GeminiVertex AI

Gemini 模型不能免费调了?新用户用这招还能免费用上最新的 Gemini Pro 模型

发布于 2025年5月19日

Gemini 2.5 Pro 的免费模型下架了,已经没法调 gemini 2.5 pro exp 模型了,只能调付费的 gemini 2.5 pro preview 模型了。

不过目前 Google Cloud 有政策,新用户注册 Google Cloud 可以送 300 刀的赠金,你可以用这个赠金通过 Google Cloud 的 Vertex AI 调用最新的 Gemini 2.5 Pro Previw,甚至还能调 Claude 大模型。

Vertex AI 是一个机器学习 (ML) 平台,它允许您训练和部署机器学习模型和 AI 应用,以及自定义大型语言模型 (LLM)。它的模型库除了自家的 Gemini,还有 Authropic、Meta 等等的大模型。

但是它不像 Gemini 那样一个 API 就可以调用,稍微有点麻烦。本文教你如何获取赠金,以及如何使用 Vertex AI。

注册 Google Cloud

前提:你需要有一张 Visa 或者 万事达 的信用卡,国内的也可以。因为它要求你绑定支付信息(但是不会自动扣款)。

虚拟卡应该是不行的,但是有的人说可以,你可以试试看。

访问 https://cloud.google.com 你可以看到上面显示着可以获取 $300 的赠金。点击免费开始使用,只要你的账号之前没有用过 Google Cloud 就都可以。

点击免费开始使用:

1、地区我选择了 Hong Kong,然后下一步

注意,这里选 HongKong 会影响你后面在 Vertex AI 中开通 Claude ,Claude 是不支持 HongKong 的,如果你有这个需求就选别的地区。只用 Gemini 就没事。

然后会要求你填写 payments profile 和 Payment method 。

2、 payments profile :地址我都是随便填的,貌似都可以,但是 Legal name 要和信用卡的名字一样。

3、Payment method :填写你的信用卡信息即可。

他有可能会验证信用卡,它会进行交易验证,交易金额为 8 港币,然后商户名称中先显示 GOOGLE*KEY xxxxxx 后面 xxxxx 就是验证码。提交即可。8 港币是仅验证的,不会交易成功的。

然后就可以啦,你就获得了 300 刀的赠金。有的账户可能会给 2000 多刀(这个我还不清是啥要求)。

另外还有个叫 Trial credit for GenAI App Builder 赠金,给了我 7000 多刀,似乎是在开通 GenAI 功能的时候给的,如果你看到了可以开通看看。这个有效期为一年。

启用 Vertex AI

点击【启用所有推荐的 API 】之后你就可以用 Vertex AI 的相关功能了。

你可以点开模型库查看哪些模型可以使用

你可以点开某个模型,启动它,就可以调用这些模型了。点开你可以看到文档里提供了 API 和 Vertex SDK 两种方式调用模型。

请注意:Anthropic 会有开通国家/地区的限制。

我们主要了解 API 如何调用

Vertex AI 的使用

说真的,Vertex API 调用非常麻烦,而且很多客户端,比如 Cherry Studio、Cursor 等都不支持,但是你可以使用 LLMs 网关工具,将 Vertex AI 转成 OpenAI 兼容格式的 API 来使用。

使用 LLMs 网关工具

我目前了解到以下工具是支持 Vertex AI 的

  • LiteLLM:支持 100多种 LLMs 访问,支持故障回退、支出追踪等功能,全面转成兼容 OpenAI 格式。
  • New API:基于 One API 二次开发的 LLM 网关,也支持很多的 LLMs 。

我们只要了解下他们需要哪些配置,以及这些配置怎么获取。

  • Vertex Project:Project ID
  • Vertex Location:所在的 location
  • Vertex Credentials:基于服务账号(Service Account) 的凭证

Project ID

点开项目设置,你可以在设置中看到项目 ID

location

这个其实也挺迷的,不知道在哪里有选过,我是在模型库的模型文档中找到的。

这也是 标准 Vertex AI 的 API 格式https://{location}-aiplatform.googleapis.com/v1/projects/{project}/locations/{location}/{model}:generateContent

从这里可以看出来,我的 location 是 use-central1

服务账号 Service Account

入口:IAM 和管理 --> 服务账号

没有服务账号的话,创建一个,然后在密钥这里添加密钥,添加一份 JSON 类型的文件,然后会生成一份文件供你下载。一定要保存好这份文件

在 LiteLLM 中会让你上传这份文件,在 New API 中,则是这份 JSON 文件的 JSON 内容。

你只要有这个三个信息就配置了。

我个人也是使用 Google Cloud 的 Cloud Run 部署了 LiteLLM Proxy,你可以 fork 我的仓库 simonwong/google-cloud-litellm 部署到你自己的 Cloud Run 中。Cloud Run 的资费也是会使用赠金的。

其他调用方式

其他方式都比较麻烦 下面简单列下了 Vertex 调用方式,你可以看看对应的文档

上面文档中会大量的提到使用 gcloud cli 来生成 access-token ,基本上就是只能本地调用,而且每小时会过期。

快速模式(express mode)

除了上面这些方式,Vertex AI 还有个快速模式(express mode).

快速模式使用起来就非常方便了,对比下 API 就知道了,不需要 location、project 等信息,你只要提供 model 和 API key 就好了。

快速模式下 Vertex AI 的 API 格式https://aiplatform.googleapis.com/v1/{model}:generateContent

PS:我试了很多次都没尝试成功,没弄懂是哪里有问题。

我看了下 gemini-balance 最近的提交似乎可以支持 Vertex Al Express API ,你们可以试试看。

不过你需要知道的是, express mode 会缺失很多功能,从 API 文档看只能支持文本输出,并且会有速率限制。

这里还有一些相关的文档供你参考:

Vertex AI in express mode overview

Vertex AI 快速模式 REST API 参考

总结

Google Cloud 的政策确实很好,但是 Vertex AI 的使用也是比较复杂,使用方式很多,文档也非常的乱。Google Cloud 也很复杂,以前没有接触过。我周末两天一直在研究如何使用,至此也没能完全教你如何使用。这里更像是一份踩坑经历。

简而言之,我推荐你使用 LLM 网关来代理 Vertex API 使用。如果你遇到什么问题,非常欢迎你联系我帮你一起看看。

其他诸如 location、express mode 的问题,如果有懂的大佬也欢迎指教下