【Deepseek v3开源】本地部署仅需700G，轻松运行！

最新推荐文章于 2025-04-15 14:43:39 发布

大模型教程

最新推荐文章于 2025-04-15 14:43:39 发布

阅读量10w+

点赞数 17

文章标签：大模型学习大模型教程人工智能大模型深度学习大模型入门程序员

本文链接：https://blog.csdn.net/2401_84204207/article/details/144777776

版权

DeepSeek V3 正式发布，模型与技术报告全开源，非常牛，又在大模型领域掀起了一股热议，概率为2句话：

便宜，正式训练成本仅要557万美元（2000张H800），而GPT-4o预估一亿美金
编程能力超过 Claude Sonnet 3.5

根据多个基准测试，DeepSeek v3 在代码方面甚至优于 Claude Sonnet 3.5

那么671B的DeepSeek V3如何本地运行尼，由于DeepSeek的框架原生采用 FP8 训练，因此仅提供 FP8 权重，预估仅700GB+显存便可轻松运行。

当然也可以转换到BF16，在半精度下，需1400GB+

量化到int4时需要300GB+

半精度 236B的DeepSeek V2，占用 490G 显存，需要 7张 80G A100

https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main``https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

在这里插入图片描述

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述