概览
针对 DeepSeek‑V3 和 Qwen 系列模型的本地部署,核心瓶颈在于 GPU 的显存与计算能力,以及配套的多核 CPU、系统内存和高速存储。以下配置覆盖从个人开发、测试到企业级生产的各类场景需求。
DeepSeek‑V3 硬件推荐
GPU & 显存
- 最低:NVIDIA A100 (80 GB)
- 推荐:NVIDIA H100 (80 GB),生产环境建议多卡(4–8 块 H100)分布式部署
- 量化方案:INT4/INT8 量化可将显存需求降至约 40 GB
CPU、内存与存储
- CPU:16 核及以上多核处理器
- 系统内存:最低 64 GB RAM,推荐 128 GB RAM
- 存储:NVMe SSD ≥ 1 TB
加速与优化框架
- 常用:LMDeploy、TensorRT‑LLM、SGLang 等
- 另可选:国内 Ascend 700/910 NPU(BF16 支持)
Qwen 系列硬件推荐
小型模型(7B / 14B)
- Qw