至顶：DeepSeek完全实用手册V1.5——技术原理、使用技巧、部署进展 2025

智能交通技术

已于 2025-04-17 08:42:25 修改

阅读量43

点赞数

文章标签： DeepSeek 大模型

于 2025-04-15 13:39:28 首次发布

原文链接：https://mp.weixin.qq.com/s?__biz=MzI5NzExMTY0Mg==&mid=2650842437&idx=1&sn=70b61688a31e499e80dfcfd043ed418b&chksm=f62610429ff68e01b28f42bcd0f51d1d5f90447a18e627c73695e8df521643f89ba5f73dc19e&scene=126&sessionid=0

版权

手册全面介绍了 DeepSeek 模型，涵盖公司与模型概况、技术原理、部署应用、使用方法及未来趋势等内容。

DeepSeek 概况：杭州深度求索人工智能基础技术研究有限公司开发，旗下的 V3 和 R1 模型备受关注。V3 是高性能对话模型，R1 是推理模型，二者在性能、成本、开源等方面优势明显，得到业界认可。

技术路线解析：R1 以 V3 为基座模型训练，采用混合专家（MoE）架构、多头潜在注意力（MLA）、多词元预测训练（MTP）、FP8 混合精度训练等技术降低成本，通过强化学习中的群体相对策略优化（GRPO）提升性能。

部署进展：在地方政府、央企、地方国企和智能终端广泛部署。地方政府用于智能问答、公文起草等；央企覆盖多领域，提升办公和生产效率；地方国企涉及多行业，助力企业智能化；智能终端搭载实现多种功能升级。

调用与部署：云端调用通过官方或第三方 API，成本低但有使用限制；本地部署需下载模型，借助工具启动，适合数据安全要求高的场景，不同版本对硬件配置要求不同。

使用方法：可独立使用，用于文本创作、知识推理等；也可与多种工具组合，如办公增效、创意设计等，通过提示工程优化输入指令，提高模型输出质量。

趋势判断：开源模型推动 AI 应用生态繁荣，推理模型有望成主流，AI 技术将广泛融入业务、个人电脑和企业算力平台，“Agent + 协议” 或成企业应用新范式。

至顶：DeepSeek完全实用手册V1.5——技术原理、使用技巧、部署进展 2025

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。