DeepSeek-R1升级：8B蒸馏模型性能比肩Qwen3-235B，已上架 Ollama，可本地部署

最新推荐文章于 2025-06-05 22:56:29 发布

小马不会过河

最新推荐文章于 2025-06-05 22:56:29 发布

阅读量968

点赞数 29

文章标签：人工智能大数据产品经理知识图谱语言模型

本文链接：https://blog.csdn.net/m0_59163425/article/details/148457386

版权

近日，DeepSeek 升级更新了 R1 模型（DeepSeek-R1-0528），推理能力、思考深度得到显著提升。其中，8B 小模型 (DeepSeek-R1-0528-Qwen3-8B)，数学能力超越 Qwen3-8B （+10.0%），与 Qwen3-235B 大模型相当。小模型的性能大幅度提升，为在终端设备部署高性能 AI 模型提供了可能性。

Ollama 为本地部署大模型的框架，DeepSeek-R1-0528-Qwen3-8B 已上架 Ollama，感兴趣的读者可尝试安装 Ollama，在本地部署运行 DeepSeek-R1-0528 模型。

本文主要内容：

DeepSeek-R1-0528 模型介绍
在 Ollama 上运行 DeepSeek-R1-0528 的 8B 模型

DeepSeek-R1-0528

✨ 核心亮点：思考更深、推理更强
- 版本号： DeepSeek-R1-0528
- 参数量：671B、8B
- 基座：基于 DeepSeek V3 Base (2024年12月)，但在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力。
- 性能表现：在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如 o3 与 Gemini-2.5-Pro🥇

🧠 推理能力大提升
- AIME 2025 数学测试：准确率从旧版 70% → 87.5%！🎯
- 思考更深：解题平均 token 用量从 12K → 23K，表明其在解题过程中进行了更为详尽和深入的思考。
- 知识蒸馏：用 R1-0528 的思维链训练的 8B 小模型 (DeepSeek-R1-0528-Qwen3-8B)，数学能力超越 Qwen3-8B （+10.0%），与 Qwen3-235B 相当！🤯

💻 其他能力更新
- ✅ 大幅减少幻觉：在改写、总结、阅读等场景，幻觉率降低 45~50%，结果更可靠。
- ✍️ 创意写作更出色：议论文、小说、散文等长文写作能力升级！篇幅更长、结构更完整、文风更贴近人类喜好！
- 🔧 工具调用：支持外部工具调用（不支持在 thinking 中进行工具调用）。
- 🚀 在前端代码生成、角色扮演等领域的能力均有更新和提升。

在 Ollama 上运行 DeepSeek-R1-0528 模型

从 Ollama 的 deepseek-r1 主页的介绍可知，8B 和 671B 模型已升级至 0528 版本。

终端上运行 ollama pull deepseek-r1:8b，下载 DeepSeek-R1-0528 的 8B 模型到本地。

下载完成后，运行 ollama run deepseek-r1:8b 命令，在终端开启与模型的对话：

9.11 和 9.9，哪个大

>>> 9.11 和 9.9，哪个大
<think>
首先，用户的问题是：“9.11 和 9.9，哪个大？”这是一个关于比较两个小数大小的简单问题。

我需要理解这两个数字：9.11 和 9.9。它们都是十进制表示，但精度不同。

- 9.11 表示九点一一，即 9 + 0.11

- 9.9 表示九点九，即 9 + 0.9

为了比较它们，我可以将两个数字对齐小数位。9.9 可以写成 9.90，以便更容易比较。

所以：

- 9.11 = 9.11

- 9.9 = 9.90（因为添加一个零不影响其值）

现在，比较整数部分：两者都是 9，所以相同。接下来比较小数部分。

小数部分：9.11 的十分位是 1，百分位是 1；而 9.90 的十分位是 9，百分位是 0（因为它是 90/100）。

更精确地：

- 9.11 = 9 + 11/100

- 9.9 = 9 + 90/100

现在比较分数部分：11/100 和 90/100。

显然，90/100 大于 11/100，因为 90 > 11。

因此，9.9（或 9.90）大于 9.11。

我可以将它们转换为分数：

- 9.11 = 911/100

- 9.9 = 99/10？不，应该是 990/100 或更准确地 9.9 = 99/10，但为了统一分母。

最好使用相同的分母。两个数字都可以表示为以 100 为单位的分数：

- 9.11 = 911/100

- 9.9 = 99/10 = (99 * 10) / (10 * 10) 不，99/10 等于 990/100？让我们计算。

99/10 = ? 要得到分母为 100 的分数，分子和分母都乘以 10：(99 * 10) / (10 * 10) = 990/100。是的。

所以：

- 9.11 = 911/100

- 9.9 = 990/100

现在比较分子：911 和 990。显然，990 > 911，所以 990/100 > 911/100。

因此，9.9 大于 9.11。

用户可能犯了一个常见错误，认为有更多的小数位就意味着更大，但在这里，9.9 相当于 9.90，而 9.90 比 9.11 大。

在之前的对话历史中，有一个问题：“99.9 和 9.11，哪个大？”我回答了，并指出 99.9 表示九十九点九。但现在用户问的是“
9.11 和 9.9”，所以是不同的数字。

确保我的回答清晰和准确。

最终答案：9.9 大于 9.11。
</think>
从数值比较的角度来看：

- **9.11** 表示九点一一（即 9 + 0.11）。
- **9.9** 表示九点九（即 9 + 0.9），也可以写成 9.90 来便于比较。

现在，将两个数字对齐小数位：
- 9.11 = 9.11
- 9.9 = 9.90

整数部分相同（都是 9），因此比较小数部分：
- 小数部分：十分位和百分位。
- 9.11 的十分位是 1，百分位是 1。
- 9.90 的十分位是 9，百分位是 0。

因为 9.90 的十分位（9）大于 9.11 的十分位（1），所以 **9.9 大于 9.11**。

或者，将两个数字转换为相同的分母：
- 9.11 = 911/100
- 9.9 = 990/100

比较分子：990 > 911，因此 **990/100 > 911/100**，即 **9.9 > 9.11**。

直观上，你可以想象一下数轴或价格比较。例如，在货币中，$9.90 比 $9.11 大。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述