Grace Blackwell NVLink 72 是英伟达推出的一款高性能计算平台,其核心组件为 NVIDIA GB200 Grace Blackwell Superchip。该系统通过第五代 NVLink 技术实现了多个 GPU 和 CPU 的高效互联,具体来说,它连接了 36 个 Grace CPU 和 72 个 Blackwell GPU,每个节点包含一个 Grace CPU 和两个 Blackwell GPU。
Grace Blackwell NVLink 72 的设计采用了液冷机架式架构,能够有效降低系统的能耗和成本。其内部使用了铜缆进行互连,总长度超过两英里,这不仅简化了操作,还显著降低了功耗。此外,该系统支持高达每秒 1.8 TB 的 GPU 到 GPU 带宽,使得大规模模型的训练速度提升了四倍,并且推理速度提升了 30 倍。
Grace Blackwell NVLink 72 集成了先进的第二代 Transformer 引擎和新一代 NVSwitch,使其在处理万亿参数的大型语言模型(LLM)时表现出色。这些特性使得 Grace Blackwell NVLink 72 成为生成式 AI、高性能计算和数据处理的理想选择。
Grace Blackwell NVLink 72 是一款面向未来 AI 和 HPC 应用的超级计算平台,通过其创新的架构和高效的互联技术,为数据中心提供了前所未有的计算能力和能效比。
Grace Blackwell NVLink 72 的具体性能指标和测试结果如下:
-
架构与设计:
- GB200 NVL72 集成了 36 个 Grace Blackwell Superchip,每个 Superchip 包含一个 72 核的 Blackwell GPU 和一个 Grace CPU。
- 使用了第五代 NVLink 技术,单个 NVLink 域内最多可连接 576 个 GPU。
- 液冷设计,使用铜缆卡套和液冷系统,显著降低成本和能耗。
-
性能指标:
- 提供双向 900 GB/s 的带宽。
- 支持 FP4、FP8、FP16 和 FP32 的张量计算性能分别为 1440 TFLOPS、700 TFLOPS、320 TFLOPS 和 640 TFLOPS。
- 内存带宽高达 13.5 TB/s,内存容