Hermes + Gemini API 配置与使用手册
一、概述
Google Gemini API 通过 OpenAI 兼容端点接入 Hermes,支持 Gemini 全系列模型,包括 thinking(推理)模型。API 免费层即可使用,无需 Gemini Chat 订阅。
二、注册 API Key
- 访问 Google AI Studio
- 使用 Google 账号登录
- 点击「Create API Key」生成密钥
- 免费层包含:60 RPM、多数标准模型免费、thinking 模型免费
三、在 Hermes 中配置
方法 A:通过环境变量(推荐)
# 在 .env 中添加
GOOGLE_API_KEY=你的API密钥
Hermes 会自动识别 GOOGLE_API_KEY 并注册 Gemini 为可用 provider。
方法 B:通过 custom_providers(精确控制)
# 在 config.yaml 中添加
custom_providers:
- name: gemini
base_url: https://generativelanguage.googleapis.com/v1beta/openai
api_key: ${GOOGLE_API_KEY}
models:
gemini-2.0-flash-thinking-exp:
type: chat
context_length: 1000000
gemini-2.5-flash-preview-04-17:
type: chat
context_length: 1000000
gemini-2.5-pro-exp-03-25:
type: chat
context_length: 1000000
gemini-3-flash-preview:
type: chat
context_length: 1000000
四、切换模型
方式 1:交互式选择
hermes model
选择 google 或 gemini provider,然后选择具体模型。
方式 2:命令行启动
hermes -m gemini/gemini-2.0-flash-thinking-exp
方式 3:会话中切换
/model gemini/gemini-2.0-flash-thinking-exp
五、支持的 Gemini 模型
| 模型 | 类型 | Thinking | 免费层可用 |
|---|---|---|---|
| gemini-2.0-flash-thinking-exp | 推理/思考 | ✅ 原生 | ✅ |
| gemini-2.5-flash-preview-04-17 | 多模态快模型 | ✅ 支持 | ✅ |
| gemini-2.5-pro-exp-03-25 | 多模态强模型 | ✅ 支持 | ✅ |
| gemini-3-flash-preview | 最新快模型 | ✅ 原生 | ✅ |
| gemini-2.0-flash | 标准模型 | ❌ | ✅ |
| gemini-2.0-flash-lite | 轻量模型 | ❌ | ✅ |
六、关于 Thinking(推理)模式
Gemini thinking 模型通过 reasoning_content 字段返回思维链(CoT)过程。
特性:
- Hermes 原生支持接收和显示 thinking tokens
- 推理 token 不会计入普通 token(不计费)
- 适合:复杂推理、数学、编程、逻辑分析
- 通过 API 参数的
thinkingConfig可控制是否返回思考内容
在 Hermes 中使用:
直接切换模型即可,无需额外配置。Hermes 会自动处理 thinking tokens 的展示。
七、Gemini Chat 会员 vs API
| 维度 | Gemini Chat(入门套餐) | Gemini API(AI Studio) |
|---|---|---|
| 用途 | gemini.google.com 聊天 | 程序化调用(Hermes 使用) |
| 费用 | 付费订阅 | 免费层 + 按量付费 |
| 额度互通 | ❌ 不共享 | 独立额度 |
| 获取 Key | 不需 API Key | aistudio.google.com 免费获取 |
| Thinking 模型 | ✅ | ✅ 免费可用 |
注意:Chat 入门套餐不提供 API 额度,但 API 免费层本身就够用,两者互不依赖。
八、常见问题
Q: Gemini 免费 API 层够用吗?
A: 够。60 RPM 限制对个人使用非常充裕,thinking 模型多数免费。
Q: 是否支持工具调用(Function Calling)?
A: Gemini API 原生支持工具调用,Hermes 通过 OpenAI 兼容端点集成。
Q: 需要绑信用卡吗?
A: 免费层不需要。超出免费层才需设置付款方式。
Q: 为什么不用 OpenRouter 走 Gemini?
A: 如果已配置 OpenRouter 也可在 OpenRouter 上使用 Gemini 模型,但直连 Google AI Studio 延迟更低且免费。