突破性能瓶颈：DeepSeek 2台 H20推理组网方案揭秘

阿古

已于 2025-03-13 10:13:56 修改

阅读量2k

点赞数 41

文章标签：人工智能 AI编程

于 2025-03-12 19:21:37 首次发布

本文链接：https://blog.csdn.net/agu/article/details/146212778

版权

概述

随着人工智能技术的迅速发展，许多企业在推理任务上面临越来越大的计算需求。在单台一体机无法满足高并发、大规模推理要求的情况下，DeepSeek 推理解决方案通过多台推理一体机组网协同工作，为企业提供灵活、高效、可扩展的解决方案。通过将多台DeepSeek H20一体机组合成推理集群，企业可以充分利用计算资源，实现高效的推理任务处理，提升业务决策的精准性和响应速度。下面以2台H20为例来说一说具体组网方案。

H20 简介

NVIDIA H20 是一款高性能的GPU，专为大规模人工智能推理任务和高吞吐量计算而设计。它基于NVIDIA的最新架构，提供强大的计算能力和优化的推理性能，适用于从深度学习推理到大规模数据处理等多种应用场景。H20搭载NVIDIA的高效计算核心和高速互联技术，能在提供卓越性能的同时，确保能效和可靠性，尤其在处理复杂的AI工作负载时展现出其卓越的优势。

作为一款专注于训练和推理的芯片，H20在大语言模型推理任务上比H100快20%。然而，H20的性能在多个方面受到限制，包括仅提供FP64精度1 TFLOPS（相比H100的34 TFLOPS）和FP16/BF16精度148 TFLOPS（相比H100的1,979 TFLOPS），这导致在带宽和计算速度等关键指标上存在限制，整体算力理论上比H100降低约80%。

我们配置了2台8卡H20 GPU服务器，用于DeepSeek的推理服务，并通过InfiniBand（IB）组网来确保网络性能达到最佳水平。这种组合在提供强大计算能力的同时，还能实现高速、低延迟的数据传输，保障了推理服务的高效性和稳定性。

下面是2台H20服务器的具体配置：

类别	详细信息
CPU	XEON 8468V *2
内存	DDRS 4800 64G * 32
GPU	NV HGX H20 8-GPU 96GB
系统盘	960G 2.5 SATA SSD * 2
数据盘	3.84T 2.5 SATA SSD * 4
磁盘阵列	4GB SAS 8 口 Raid 卡
IB 卡（计算）	NDR CX7 400G 单口 HCA 卡 * 4
IB 卡（存储）	NDR CX7 200G 单口 HCA 卡 * 1
管理网卡	10G * 2

其中计算网的IB卡为 400G的 CX7 单口卡。根据这个卡的型号好端口的速率，我们知道需要组建 400G的IB网络。

计算网组网：

根据H20机器配备的CX7 400G单口网卡，我们知道需要组建的计算网络为400G的IB网，因此我们需要型号为 MQM9700-NS2R 的NDR交换机，以及800G的光模块 400G的光模块和400G的mpo光纤。

下面为需要的组网清单：

设备名称	产品编码	描述	数量
NDR交换机	MQM9700-NS2R	NVIDIA Mellanox Quantum 2 based NDR InfiniBand Switch, 64 NDR ports, 32 OSFP ports, 2 Power Supplies (AC), Standard depth, managed, C2P airflow, Rail Kit	1
光模块800G	MMA4Z00-NS	NVIDIA twin port transceiver, 800Gbps,2xNDR, OSFP, 2xMPO12 APC, 850nm MM F, up to 50m, finned	4
光模块400G	MMA4Z00-NS400	NVIDIA single port transceiver, 400Gbps,NDR, OSFP, MPO12 APC, 850nm MMF, up to 50m, flat top	8
MPO 光纤	MFP7E10-N007	NVIDIA passive fiber cable, MMF, MPO12 APC to MPO12 APC, 7m	8

其中 NDR交换机推荐使用带R 的反向的交换机，这样的好处是热风不会直接吹在光模块上从而减少光模块的故障率。型号也需要是9700的不能是9790，9700的交换机是带管理功能的，可以直接在里面开启子网服务。如果使用9790还需要额外配置UFM才能工作，费用就会高很多。 MFP7E10-N007 为7米的MPO线，只有2台H20的情况下，我们是建议 H20和交换机放在同一个机柜或者相邻的机柜，这样7米的mpo线也足够长度使用的了。 800G光模块是插在9700交换机上的， 400G光模块是用在H20的IB网卡上的。

下面为计算网的拓扑网络图：