私有化部署DeepSeek指南：基于Ollama的本地化实践与硬件推荐

好奇的菜鸟

已于 2025-02-26 08:22:49 修改

阅读量1.1k

点赞数 20

分类专栏： Tools 文章标签： DeepSeek

于 2025-02-25 15:12:11 首次发布

本文链接：https://blog.csdn.net/qq_29752857/article/details/145853901

版权

157 篇文章

订阅专栏

本文将介绍如何通过Ollama在本地私有化部署DeepSeek系列模型，提供全量模型命令并解释参数功能，同时针对不同参数规模推荐笔记本显卡配置。

验证安装

# 官网地址
https://ollama.com/download
# 查看版本（当前最新版本为0.5.12）
ollama --version

# 查看帮助文档
ollama --help

模型参数	部署命令	功能说明
1.5B	`ollama run deepseek-r1:1.5b`	超轻量模型，适合文本摘要、简单问答，笔记本低显存场景优先选择
7B	`ollama run deepseek-r1:7b`	平衡型模型，支持复杂对话和代码生成，需中端显卡（推荐RTX 3060+）
8B	`ollama run deepseek-r1:8b`	7B增强版，推理能力提升，显存需求略高于7B
14B	`ollama run deepseek-r1:14b`	高性能模型，适用于专业领域分析，需高端笔记本显卡（如RTX 3080 16GB）
32B	`ollama run deepseek-r1:32b`	企业级模型，需外接eGPU或工作站级硬件，适合复杂任务处理
70B	`ollama run deepseek-r1:70b`	需服务器级硬件支持，笔记本需通过Thunderbolt外接多显卡（如双RTX 4090）
671B	`ollama run deepseek-r1:671b`	超大规模模型，需分布式计算支持，非普通笔记本适用

参数功能说明：

https://nodejs.org/download/release/v20.18.0/

部署WebUI
克隆开源项目 ollama-webui-lite：

git clone https://github.com/ollama-webui/ollama-webui-lite
cd ollama-webui-lite
npm install
npm run dev

模型参数	显存需求（量化后）	推荐笔记本显卡	性能优化建议
1.5B	2-3GB	NVIDIA RTX 3050 (4GB)	无需量化，直接运行
7B	6-8GB	NVIDIA RTX 3060 (6/12GB)	使用`-q4_K`量化，设置`--num-gpu-layers 30`
14B	10-12GB	NVIDIA RTX 3080 (16GB)	推荐`-q5_K_M`量化，GPU层数不超过40
70B	24-32GB+	外接eGPU（如RTX 4090 24GB）	必须量化+多GPU并行，限制生成长度

混合计算模式
添加 --num-gpu-layers 50 参数（如ollama run deepseek-r1:7b --num-gpu-layers 50），优先使用GPU计算。
量化版本选择
在模型名称后追加量化标识，例如 deepseek-r1:7b-q4_K，平衡性能与显存占用。