发布日期
2026-06-21
改进点分析
⚡ Core - Agent 步长与缓存优化
- Agent 步长限制处理 — 当 Agent 达到步数限制时,强制输出最终文本响应而非直接中断。修复了 Agent 在极限步数时静默失败的常见问题。
- Devstral 模型检测修复 — 解决 provider ID 大小写不一致导致的模型识别失败(@Robin1987China 贡献)。提示中国区用户的使用场景。
- Copilot 模型自定义请求头 — 自定义请求头现在能正确传递到 Copilot 模型请求中。
💡 Prompt 缓存优化
- 关键改进:不再包裹后续用户消息 — 取消了对后续用户消息的 steering reminder(引导提示)包裹,从而让 prompt 缓存保持有效。这对 API 成本优化有显著意义——减少重复的引导前缀可以延长 KV 缓存的命中。
🧠 版本特征
以"可靠性 + 成本优化"为主题的版本。Agent 步长处理提升了长任务的稳定性,Prompt 缓存优化则直接关系到高频率使用场景的 API 开销。
🤔 关注点
Think 变体增加了对 GLM-5.2 的 high / max 支持,支持多 provider。继续拓展多 provider 生态适配。