deepseek 671B 版本推理究竟需要什么样的GPU H100, H20, A6000,TRX 4090

deepseek 671B 推理究竟需要什么样的GPU硬件

结论

根据较可信任的资料,deepseek 671B(满血版) 有多个量化版本可以基于8卡GPU服务器进行部署。

Below is the breakdown of VRAM requirements for the 4-bit quantization of DeepSeek-R1 models:

ModelParameters (B)VRAM (4-bit Quantization)Recommended GPU
DeepSeek-R1-Zero671B~436 GBMulti-GPU setup (e.g., NVIDIA A100 80GB x6)
DeepSeek-R1671B~436 GBMulti-GPU setup (e.g., NVIDIA A100 80GB x6)
DeepSeek-R1-Distill-Llama-70B70B~181 GBMulti-GPU setup (e.g., NVIDIA A100 80GB x3)


671B 量化版本
在这里插入图片描述
基于4/ 8卡96G 显存H20 , 预测速度22tps 8张卡每张卡显存占用3038G,4张H20每卡显存约60 70G
在这里插入图片描述
据此推断:
基于8卡 24G 显存的4090 全可以考虑1.58-bit版本,预测速度预估3~10TPS (待验证)
或者 8卡 48G显存的A6000. 可以考虑2.51-bit量化版本 预测速度预估3~10TPS (待验证)
或者 8卡 80G显存的H800. 可以考虑2.51-bit量化版本 预测速度预估20~30TPS (待验证)

MoEBitsTypeDisk Size Accuracy
1.58bitIQ1_S131GB正常
1.73bitIQ1_M158GB
2.22bitIQ2_XXS183GB更好
2.51bitQ2_K_XL212GB最好

相关硬件参数规格数据参考(待检查)
以下是NVIDIA H100、A100、A6000、A4000、V100、P6000、RTX 4000、L40s、L4的主要性能指标参数表:

GPU型号架构 FP16性能FP32性能显存显存类型带宽
H100Hopper1,671 TFLOPS60 TFLOPS80GB HBM33.9 TB/s
A100Ampere312 TFLOPS19.5 TFLOPS40GB / 80GB HBM22,039 GB/s
A6000Ampere77.4 TFLOPS38.7 TFLOPS48GB GDDR6768 GB/s
A4000Ampere19.17 TFLOPS19.17 TFLOPS16GB GDDR6448 GB/s
V100Volta125 TFLOPS15.7 TFLOPS32GB HBM2900 GB/s
P6000Pascal12 TFLOPS12 TFLOPS24GB GDDR5X432 GB/s
RTX 4000Turing14.2 TFLOPS7.1 TFLOPS8GB GDDR6416 GB/s
RTX 4090Ada Lovelace40 TFLOPS20 TFLOPS24GB GDDR6X1008 GB/s
RTX 4090DAda Lovelace80 TFLOPS40 TFLOPS24GB GDDR6X1008 GB/s
L40sAda Lovelace731 TFLOPS91.6 TFLOPS48GB GDDR6864GB/s
L4Ada Lovelace242 TFLOPS (Tensor Core)30 TFLOPS24GB GDDR6300GB/s

参考链接

H20 *3~4 96G显存
https://zhuanlan.zhihu.com/p/21274285958

DeepSeek-R1 671B本地运行指南
http://www.hubwiz.com/blog/deepseek-r1-671b-local-run-guide/

跟进DeepSeek-R1:动手部署671B模型推理(2.51-bit量化)
https://zhuanlan.zhihu.com/p/21274285958

在这里插入图片描述
A100 80G显存
https://apxml.com/posts/gpu-requirements-deepseek-r1

Run DeepSeek R1 Dynamic 1.58-bit
https://unsloth.ai/blog/deepseekr1-dynamic

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

君宝bob

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值