DeepSeek系列模型个人与企业部署手册，看这一篇就行_为什么一个14b的模型仅仅9个g-CSDN博客

本文链接：https://blog.csdn.net/m0_59235245/article/details/145522392

第一个问题

在资源有限的情况下，个人进行数学相关学习和教学研究，应该选择哪款模型进行部署？

答：
DeepSeek-R1-Distill-Qwen-1.5B 和 DeepSeek-R1-Distill-Qwen-7B 是专门针对数学领域优化的模型。如果资源允许，建议优先部署 DeepSeek-R1-Distill-Qwen-7B，因为它的性能更强；但如果资源有限，部署 DeepSeek-R1-Distill-Qwen-1.5B 也完全能够满足日常的学习和教学研究需求。

第二个问题

在资源有限的情况下，个人进行编码相关工作，最小应该部署哪款模型？

答：
如果仅进行基础的编码工作，最小可以部署 DeepSeek-R1-Distill-Qwen-7B。如果条件稍好，建议部署 DeepSeek-R1-Distill-Qwen-14B。如果预算充足，那就直接选择 DeepSeek-R1-Distill-Qwen-32B，能力性能更为优越。

第三个问题

企业部署时，使用4090显卡最少需要几块？部署时有哪些需要注意的坑？

答：
如果使用 vLLM 部署原始的 DeepSeek-R1-Distill-Qwen-32B（约70GB），至少需要 4 块 4090 显卡。具体部署命令如下：

CUDA_VISIBLE_DEVICES=0,1,2,3 vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 4 --max-model-len 32768 --enforce-eager

注意事项：

如果在 GPU 宿主机上采用 Conda 管理环境进行部署，只需安装 vLLM 的最新版即可。
如果在 GPU 宿主机上通过 Docker 进行部署，Docker中除了安装 vLLM 最新版外，最需要注意的是 Docker 内的 CUDA 版本必须与宿主机的 CUDA 版本一致，并且不大于宿主机的版本。例如：如果宿主机 CUDA 版本为 12.4，则 Docker 内的 CUDA 版本应为 12.0 至 12.3。
该命令部署后启动的是标准的 OpenAI API。

第四个问题

Ollama 可以在企业部署中使用吗？

答：
可以使用。与此同时，Ollama 对 DeepSeek-R1 进行了瘦身，非常适合企业部署 DeepSeek-R1-Distill-Qwen-32B（瘦身版，20GB）。使用一块 4090 显卡即可启动。

了解模型的大小

将DeepSeek-R1原始模型和Ollama瘦身后模型列出，可供大家参考。

DeepSeek-R1各模型原始大小：

DeepSeek-R1模型参数：671B（6710亿），模型大小：约720G。

DeepSeek-R1-Distill-Qwen-1.5B模型参数1.5B（15亿），模型大小：约4G

DeepSeek-R1-Distill-Qwen-7B模型参数7B （70亿），模型大小：约15G

DeepSeek-R1-Distill-Llama-8B模型参数8B（80亿），模型大小：约16G

DeepSeek-R1-Distill-Qwen-14B模型参数14B（140亿），模型大小：约30G

DeepSeek-R1-Distill-Qwen-32B模型参数32B（320亿），模型大小：约75G

DeepSeek-R1-Distill-Llama-70B模型参数70B（700亿），模型大小：约140G

Ollama瘦身后模型大小：

DeepSeek-R1模型参数：671B（6710亿），模型大小：约404G。

DeepSeek-R1-Distill-Qwen-1.5B模型参数1.5B（15亿），模型大小：约1.1G

DeepSeek-R1-Distill-Qwen-7B模型参数7B （70亿），模型大小：约4.7G

DeepSeek-R1-Distill-Llama-8B模型参数8B（80亿），模型大小：约4.9G

DeepSeek-R1-Distill-Qwen-14B模型参数14B（140亿），模型大小：约9G

DeepSeek-R1-Distill-Qwen-32B模型参数32B（320亿），模型大小：约20G

DeepSeek-R1-Distill-Llama-70B模型参数70B（700亿），模型大小：约43G

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述