为什么DeepSeek出来可以轰动全世界，而豆包、Kimi、文心一言等却没这么大的动静呢?

最新推荐文章于 2025-05-14 14:43:48 发布

指尖下的技术

最新推荐文章于 2025-05-14 14:43:48 发布

阅读量1.1k

点赞数 11

分类专栏： DeepSeek 文章标签：人工智能人机交互

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38737545/article/details/145477769

版权

DeepSeek 专栏收录该内容

7 篇文章

订阅专栏

DeepSeek、豆包、Kimi等虽然都是大模型训练的产物，但是使用的训练模型不一样，导致功能不一样。

DeepSeek使用的是推理模型，其他使用的是普通模型。

这里先分两类，一类是DeepSeek简称DS，一类是其他包括豆包、Kimi等。

由于两者使用的模型不同导致核心目标不一样：

其他：文本生成、基础问答、信息检索
DS: 多步骤逻辑推理、复杂问题解决、因果分析

训练数据不一样：

其他：通用语料（网页、书籍、对话等）
DS：增加逻辑题、数学题、科学推理等结构化数据

训练方法不一样：

其他：自回归语言建模
DS：结合思维链（CoT）、程序辅助、符号逻辑增强

输出特点不一样

其他：流畅但可能缺乏深度逻辑
DS：结构化、分步骤、注重因果链推导

由于DS的模型开源，我们现在可以将DS部署到本地，并为其提供不同类型的数据来训练，以使其成为我们自己的助手。通过喂不同类型的数据，我们可以观察到不同的训练结果，从而提高DS的可玩性。在接下来的教程中，我将向大家展示如何将DS部署到本地，并为其提供不同类型的数据来训练，以帮助我们打造一个个性化的、高效的助手。请期待！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

指尖下的技术 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。