ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU兼容性

「C++ 40 周年」主题征文大赛(有机会与C++之父现场交流!) 10w+人浏览 756人参与

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Ollama 2025年12月3日发布了 v0.13.1 版本更新,本次更新重点引入了两个新的模型家族,并带来了多项功能增强、错误修复及底层改进,进一步提升了模型的部署灵活性与运行稳定性。

一、 全新模型登场

  1. Ministral-3 系列:此系列模型专为边缘部署设计,能够在广泛的硬件设备上高效运行,为资源受限的环境提供了强大的本地AI能力。
  2. Mistral-Large-3 系列:这是一个通用的多模态混合专家(MoE)模型,旨在处理生产级任务和企业级工作负载,在复杂场景下表现出色。

二、 核心功能与改进

  1. 引擎与工具调用

    • nomic-embed-text 模型现在默认使用 Ollama 自身的引擎运行。
    • cogito-v2.1 模型新增了工具调用(tool calling)支持。
    • 同样为 cogito-v2.1 模型添加了思维链(thinking)解析功能。
  2. GPU 与系统兼容性修复

    • 修复了 CUDA VRAM 发现的相关问题。
    • 解决了在仅配备 CPU 的系统上,模型可能被错误驱逐(evict)的问题。
    • 修复了在某些旧款 GPU 上无法检测到 CUDA 的问题。
    • 改进了对 CUDA 计算能力(CC)与目标库版本的兼容性验证。
    • (Windows系统)增加了对 PATH 中潜在不兼容库文件(如 ggml-base.dll)的检测与警告。
  3. 错误处理与用户体验

    • Ollama 现在能够更好地呈现和渲染错误信息,而非简单地显示 “Unmarshal: errors”。
    • API 客户端 (api/client) 增强了对非 JSON 格式流式错误响应的处理能力。
  4. 应用与文档

    • 修复了应用内连接打开逻辑,优化了用户体验。
    • 更新了应用内帮助链接,使其指向官方文档网站。
    • 清理了文档中已弃用参数(如 mirostat, mirostat_eta, mirostat_tau)的说明。

三、 重要代码变更摘要

本次更新包含了 18个提交,涉及 33个文件 的更改,由 12位贡献者 共同完成。部分关键变更包括:

  • API/客户端:增强了错误处理逻辑,当服务器返回非JSON格式的错误响应(如纯文本或HTML)时,能正确传递状态码和错误信息。
  • 应用层:优化了 macOS 和 Windows 系统上处理自定义 URL 协议(如 ollama://)的逻辑。
  • 模型支持
    • ministral-3:模型支持现已集成,并添加了相应的测试。
    • deepseek2:升级以支持运行 v3+ 版本的模型。
    • 模型解析器:新增了针对 cogito-v2.1 模型的专用解析器,以支持其独特的工具调用和思维格式。
    • mistral3 模型结构:在转换逻辑中增加了对 LLAMA 4 缩放因子等新 rope 参数的支持。
  • 底层与发现
    • GPU 发现:改进了设备发现机制,避免库路径重叠,并加入了对 NVIDIA Jetson Jetpack 版本的更精确匹配要求。
    • KV 缓存:测试现在同时覆盖使用和不使用 PermutedV 的情况。
    • LLM 服务器:修正了在仅有 CPU 的系统上进行模型布局验证的逻辑,防止不必要的模型驱逐。

四、 其他调整

  • 将 Vulkan 着色器文件标记为“已供应”文件。
  • 更新了 .gitattributes 以正确归类相关文件。
  • 移除了代码检查工具中的 gocritic 规则。

总结

代码地址:github.com/ollama/ollama

Ollama v0.13.1 版本是一个以模型扩展和系统稳固性为主的更新。它不仅为用户带来了适用于边缘和企业场景的新模型选择,还通过一系列关键的缺陷修复和兼容性改进,显著提升了软件在各类硬件环境下的可靠性和用户体验。特别是对 cogitoministral 系列模型支持的增强,展现了 Ollama 生态持续扩展对多样化模型架构的兼容能力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

福大大架构师每日一题

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值