v1.17.9 (2026-06-21)

发布日期

2026-06-21

改进点分析

⚡ Core - Agent 步长与缓存优化

Agent 步长限制处理 — 当 Agent 达到步数限制时，强制输出最终文本响应而非直接中断。修复了 Agent 在极限步数时静默失败的常见问题。
Devstral 模型检测修复 — 解决 provider ID 大小写不一致导致的模型识别失败（@Robin1987China 贡献）。提示中国区用户的使用场景。
Copilot 模型自定义请求头 — 自定义请求头现在能正确传递到 Copilot 模型请求中。

💡 Prompt 缓存优化

关键改进：不再包裹后续用户消息 — 取消了对后续用户消息的 steering reminder（引导提示）包裹，从而让 prompt 缓存保持有效。这对 API 成本优化有显著意义——减少重复的引导前缀可以延长 KV 缓存的命中。

🧠 版本特征

以"可靠性 + 成本优化"为主题的版本。Agent 步长处理提升了长任务的稳定性，Prompt 缓存优化则直接关系到高频率使用场景的 API 开销。

🤔 关注点

Think 变体增加了对 GLM-5.2 的 high / max 支持，支持多 provider。继续拓展多 provider 生态适配。