ollama v0.12.1 更新详解：新增 Qwen3 Embedding、云模型支持与多项功能修复

最新推荐文章于 2025-09-28 06:26:07 发布

福大大架构师每日一题

最新推荐文章于 2025-09-28 06:26:07 发布

阅读量956

点赞数 17

CC 4.0 BY-SA版权

分类专栏：文心一言vschatgpt 文章标签： embedding ollama

本文链接：https://blog.csdn.net/weixin_48502062/article/details/152051193

761 篇文章

订阅专栏

在这里插入图片描述

Ollama 在 2025 年 9 月 21 日发布 v0.12.1 预发布版本，并在 9 月 24 日正式发布。本次更新不仅带来了全新的 Qwen3 Embedding 模型，还在工具调用、云模型交互、Linux 平台登录等方面进行了优化和修复，是一次功能与稳定性同步提升的重要版本。

Qwen3-Coder 支持 Tool Calling
在代码生成和解析场景中，可以直接调用外部工具处理数据，提升自动化能力。
Harmony 消息解析器
Harmony 流式消息处理新增工具支持、思维链输出支持，可处理函数名映射，并在消息结束时完成工具参数解析。
Ollama 云模型支持
引入 cloud.md 文档并上线云模型功能，用户可在没有高性能 GPU 的情况下运行超大模型，如：
- gpt-oss:20b-cloud
- deepseek-v3.1:671b-cloud
- qwen3-coder:480b-cloud
  云模型可以通过 ollama run 或 ollama pull + ollama signin 来使用。

Gemma3 QAT 模型 Rope Scaling 修复
官方 QAT 欠标定的 rope.scaling.factor（错误设为 8）被修正为正确值（1）。
Qwen3-Coder 在 Function Calling 解析 & 字符时的 Bug 修复
解决了在参数中出现 & 时解析失败的问题。
Linux 平台 ollama signin 登录问题修复
改进了私钥读取与公钥获取逻辑，修复 Linux 下无法正确登录的情况。
连接状态提示优化
连接云模型时，客户端不再错误地显示 “connection lost”，提示逻辑更为准确。

本版本在集成测试方面做了大量调整：

统一蓝天测试提示词
将「why is the sky blue?」统一替换为更明确的 blueSkyPrompt（包含简短事实性回答要求），并维护统一的 blueSkyExpected 响应关键字列表。
并行上下文测试
- 新增 TestParallelGenerateWithHistory 与 TestParallelChatWithHistory，在多个并行会话中验证上下文延续性。
架构兼容测试
- 在执行模型测试时支持 OLLAMA_TEST_ARCHITECTURE 环境变量，过滤与当前运行架构不匹配的模型。
性能测试改进
- 输出 CSV 格式性能数据，增加近似 PromptEvalCount 以方便跨版本对比。