ollama v0.12.1 更新详解:新增 Qwen3 Embedding、云模型支持与多项功能修复

#编程达人挑战赛·第1期#

在这里插入图片描述

一、版本概述

Ollama 在 2025 年 9 月 21 日发布 v0.12.1 预发布版本,并在 9 月 24 日正式发布。本次更新不仅带来了全新的 Qwen3 Embedding 模型,还在工具调用、云模型交互、Linux 平台登录等方面进行了优化和修复,是一次功能与稳定性同步提升的重要版本。


二、核心更新内容

1. 新增模型

  • Qwen3 Embedding
    高性能的开源向量嵌入模型,由 Qwen 团队提供,适用于搜索、推荐、语义匹配等任务。

2. 新功能与支持

  • Qwen3-Coder 支持 Tool Calling
    在代码生成和解析场景中,可以直接调用外部工具处理数据,提升自动化能力。
  • Harmony 消息解析器
    Harmony 流式消息处理新增工具支持、思维链输出支持,可处理函数名映射,并在消息结束时完成工具参数解析。
  • Ollama 云模型支持
    引入 cloud.md 文档并上线云模型功能,用户可在没有高性能 GPU 的情况下运行超大模型,如:
    • gpt-oss:20b-cloud
    • deepseek-v3.1:671b-cloud
    • qwen3-coder:480b-cloud
      云模型可以通过 ollama runollama pull + ollama signin 来使用。

3. 主要修复与改进

  • Gemma3 QAT 模型 Rope Scaling 修复
    官方 QAT 欠标定的 rope.scaling.factor(错误设为 8)被修正为正确值(1)。
  • Qwen3-Coder 在 Function Calling 解析 & 字符时的 Bug 修复
    解决了在参数中出现 & 时解析失败的问题。
  • Linux 平台 ollama signin 登录问题修复
    改进了私钥读取与公钥获取逻辑,修复 Linux 下无法正确登录的情况。
  • 连接状态提示优化
    连接云模型时,客户端不再错误地显示 “connection lost”,提示逻辑更为准确。

4. API 变化

  • 移除了部分 Signout 方法中的 encodedKey 参数,操作更简化。
  • AuthorizationError 增加了 signin_url 字段,允许直接显示登录链接。
  • 流式 API 中新增对 signin_url 的解析与输出,便于快速跳转认证。

三、测试与质量保障更新

本版本在集成测试方面做了大量调整:

  1. 统一蓝天测试提示词
    将「why is the sky blue?」统一替换为更明确的 blueSkyPrompt(包含简短事实性回答要求),并维护统一的 blueSkyExpected 响应关键字列表。
  2. 并行上下文测试
    • 新增 TestParallelGenerateWithHistoryTestParallelChatWithHistory,在多个并行会话中验证上下文延续性。
  3. 架构兼容测试
    • 在执行模型测试时支持 OLLAMA_TEST_ARCHITECTURE 环境变量,过滤与当前运行架构不匹配的模型。
  4. 性能测试改进
    • 输出 CSV 格式性能数据,增加近似 PromptEvalCount 以方便跨版本对比。

四、Harmony 模块增强

Harmony 消息处理器(HarmonyMessageHandler)新增功能:

  • 初始化阶段可重命名工具函数,避免命名冲突。
  • 在流式解析过程中积累工具调用信息,并在消息完成时统一解析。
  • 内置 HasToolSupportHasThinkingSupport 接口,实现工具调用与思维链内容同步支持。

这对于高级多工具交互的 AI 应用场景非常实用,例如自动化代码生成、数据管道处理等。


五、开发者与用户影响

  • 开发者:API 接口变化需要同步适配,尤其是 Signout 签名与 Tool Calling 的调用方式。
  • 用户:可以无需高性能 GPU 直接运行云端大模型,且在 Linux 平台登录更顺畅,交互体验更佳。
  • 模型使用者:Qwen3 Embedding 将提升搜索与语义任务的精度,Harmony 工具支持可以在复杂任务中带来更高的可扩展性。

六、总结

Ollama v0.12.1 是一次功能与稳定性均有提升的版本,亮点包括:

  1. 上线 Qwen3 Embedding 与云模型,让硬件门槛大幅降低;
  2. Harmony 工具支持与思维链功能完善;
  3. 关键 Bug 修复,尤其是 Gemma3 Rope Scaling 与 Qwen3-Coder 解析问题;
  4. 测试体系优化,为后续版本稳定打下基础。

对于正在使用 Ollama 进行大模型开发与部署的用户,这次版本更新值得立即升级体验。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

福大大架构师每日一题

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值