Hermes Gemini API 手册

Hermes + Gemini API 配置与使用手册

一、概述

Google Gemini API 通过 OpenAI 兼容端点接入 Hermes,支持 Gemini 全系列模型,包括 thinking(推理)模型。API 免费层即可使用,无需 Gemini Chat 订阅。

二、注册 API Key

  1. 访问 Google AI Studio
  2. 使用 Google 账号登录
  3. 点击「Create API Key」生成密钥
  4. 免费层包含:60 RPM、多数标准模型免费、thinking 模型免费

三、在 Hermes 中配置

方法 A:通过环境变量(推荐)

# 在 .env 中添加
GOOGLE_API_KEY=你的API密钥

Hermes 会自动识别 GOOGLE_API_KEY 并注册 Gemini 为可用 provider。

方法 B:通过 custom_providers(精确控制)

# 在 config.yaml 中添加
custom_providers:
  - name: gemini
    base_url: https://generativelanguage.googleapis.com/v1beta/openai
    api_key: ${GOOGLE_API_KEY}
    models:
      gemini-2.0-flash-thinking-exp:
        type: chat
        context_length: 1000000
      gemini-2.5-flash-preview-04-17:
        type: chat
        context_length: 1000000
      gemini-2.5-pro-exp-03-25:
        type: chat
        context_length: 1000000
      gemini-3-flash-preview:
        type: chat
        context_length: 1000000

四、切换模型

方式 1:交互式选择

hermes model

选择 google 或 gemini provider,然后选择具体模型。

方式 2:命令行启动

hermes -m gemini/gemini-2.0-flash-thinking-exp

方式 3:会话中切换

/model gemini/gemini-2.0-flash-thinking-exp

五、支持的 Gemini 模型

模型 类型 Thinking 免费层可用
gemini-2.0-flash-thinking-exp 推理/思考 ✅ 原生
gemini-2.5-flash-preview-04-17 多模态快模型 ✅ 支持
gemini-2.5-pro-exp-03-25 多模态强模型 ✅ 支持
gemini-3-flash-preview 最新快模型 ✅ 原生
gemini-2.0-flash 标准模型
gemini-2.0-flash-lite 轻量模型

六、关于 Thinking(推理)模式

Gemini thinking 模型通过 reasoning_content 字段返回思维链(CoT)过程。

特性:

  • Hermes 原生支持接收和显示 thinking tokens
  • 推理 token 不会计入普通 token(不计费)
  • 适合:复杂推理、数学、编程、逻辑分析
  • 通过 API 参数的 thinkingConfig 可控制是否返回思考内容

在 Hermes 中使用:

直接切换模型即可,无需额外配置。Hermes 会自动处理 thinking tokens 的展示。

七、Gemini Chat 会员 vs API

维度 Gemini Chat(入门套餐) Gemini API(AI Studio)
用途 gemini.google.com 聊天 程序化调用(Hermes 使用)
费用 付费订阅 免费层 + 按量付费
额度互通 ❌ 不共享 独立额度
获取 Key 不需 API Key aistudio.google.com 免费获取
Thinking 模型 ✅ 免费可用

注意:Chat 入门套餐不提供 API 额度,但 API 免费层本身就够用,两者互不依赖。

八、常见问题

Q: Gemini 免费 API 层够用吗?
A: 够。60 RPM 限制对个人使用非常充裕,thinking 模型多数免费。

Q: 是否支持工具调用(Function Calling)?
A: Gemini API 原生支持工具调用,Hermes 通过 OpenAI 兼容端点集成。

Q: 需要绑信用卡吗?
A: 免费层不需要。超出免费层才需设置付款方式。

Q: 为什么不用 OpenRouter 走 Gemini?
A: 如果已配置 OpenRouter 也可在 OpenRouter 上使用 Gemini 模型,但直连 Google AI Studio 延迟更低且免费。

九、参考链接