一、版本概述
Ollama 在 2025 年 9 月 21 日发布 v0.12.1 预发布版本,并在 9 月 24 日正式发布。本次更新不仅带来了全新的 Qwen3 Embedding 模型,还在工具调用、云模型交互、Linux 平台登录等方面进行了优化和修复,是一次功能与稳定性同步提升的重要版本。
二、核心更新内容
1. 新增模型
- Qwen3 Embedding
高性能的开源向量嵌入模型,由 Qwen 团队提供,适用于搜索、推荐、语义匹配等任务。
2. 新功能与支持
- Qwen3-Coder 支持 Tool Calling
在代码生成和解析场景中,可以直接调用外部工具处理数据,提升自动化能力。 - Harmony 消息解析器
Harmony 流式消息处理新增工具支持、思维链输出支持,可处理函数名映射,并在消息结束时完成工具参数解析。 - Ollama 云模型支持
引入cloud.md
文档并上线云模型功能,用户可在没有高性能 GPU 的情况下运行超大模型,如:gpt-oss:20b-cloud
deepseek-v3.1:671b-cloud
qwen3-coder:480b-cloud
云模型可以通过ollama run
或ollama pull
+ollama signin
来使用。
3. 主要修复与改进
- Gemma3 QAT 模型 Rope Scaling 修复
官方 QAT 欠标定的rope.scaling.factor
(错误设为 8)被修正为正确值(1)。 - Qwen3-Coder 在 Function Calling 解析 & 字符时的 Bug 修复
解决了在参数中出现&
时解析失败的问题。 - Linux 平台
ollama signin
登录问题修复
改进了私钥读取与公钥获取逻辑,修复 Linux 下无法正确登录的情况。 - 连接状态提示优化
连接云模型时,客户端不再错误地显示 “connection lost”,提示逻辑更为准确。
4. API 变化
- 移除了部分 Signout 方法中的
encodedKey
参数,操作更简化。 AuthorizationError
增加了signin_url
字段,允许直接显示登录链接。- 流式 API 中新增对
signin_url
的解析与输出,便于快速跳转认证。
三、测试与质量保障更新
本版本在集成测试方面做了大量调整:
- 统一蓝天测试提示词
将「why is the sky blue?」统一替换为更明确的blueSkyPrompt
(包含简短事实性回答要求),并维护统一的blueSkyExpected
响应关键字列表。 - 并行上下文测试
- 新增
TestParallelGenerateWithHistory
与TestParallelChatWithHistory
,在多个并行会话中验证上下文延续性。
- 新增
- 架构兼容测试
- 在执行模型测试时支持
OLLAMA_TEST_ARCHITECTURE
环境变量,过滤与当前运行架构不匹配的模型。
- 在执行模型测试时支持
- 性能测试改进
- 输出 CSV 格式性能数据,增加近似 PromptEvalCount 以方便跨版本对比。
四、Harmony 模块增强
Harmony 消息处理器(HarmonyMessageHandler
)新增功能:
- 初始化阶段可重命名工具函数,避免命名冲突。
- 在流式解析过程中积累工具调用信息,并在消息完成时统一解析。
- 内置
HasToolSupport
与HasThinkingSupport
接口,实现工具调用与思维链内容同步支持。
这对于高级多工具交互的 AI 应用场景非常实用,例如自动化代码生成、数据管道处理等。
五、开发者与用户影响
- 开发者:API 接口变化需要同步适配,尤其是 Signout 签名与 Tool Calling 的调用方式。
- 用户:可以无需高性能 GPU 直接运行云端大模型,且在 Linux 平台登录更顺畅,交互体验更佳。
- 模型使用者:Qwen3 Embedding 将提升搜索与语义任务的精度,Harmony 工具支持可以在复杂任务中带来更高的可扩展性。
六、总结
Ollama v0.12.1 是一次功能与稳定性均有提升的版本,亮点包括:
- 上线 Qwen3 Embedding 与云模型,让硬件门槛大幅降低;
- Harmony 工具支持与思维链功能完善;
- 关键 Bug 修复,尤其是 Gemma3 Rope Scaling 与 Qwen3-Coder 解析问题;
- 测试体系优化,为后续版本稳定打下基础。
对于正在使用 Ollama 进行大模型开发与部署的用户,这次版本更新值得立即升级体验。