Nvidia 正在将其 GH200 芯片应用于欧洲超级计算机,研究人员正在着手研究这些系统并发布带有性能基准的研究论文。
在第一篇论文《理解紧密耦合异构系统中的数据移动:以 Grace Hopper 超级芯片为例》中,研究人员对 GH200 的各种应用进行了基准测试,该芯片集成了 CPU 和 GPU。这些数字突显了该芯片的惊人速度以及 AI 和科学应用程序性能如何从本地化的 HBM3 和 DDR5 内存中受益。
Alps 系统的一项基准测试(仍在升级)用于测量 GH200 运行 AI 应用程序时的性能。
另一篇论文《使用百亿亿次气候模拟器提高地球系统模型输出并节省 PB 级存储空间》测量了 Frontier 中 GH200 到 AMD MI250X 的大型集群、Leonardo 中的 Nvidia A100 以及 Summit 中的 Nvidia V100 的性能。这些系统曾位居 Top500 排行榜榜首,现在已进入前十。
GH200 将 Nvidia 专有的 72 个 ARM Neoverse V2 CPU 核心与 132 个 GPU 流处理器直接连接起来。CPU 和 GPU 通过 NVLink-C2C 互连进行通信,该互连以 900GB/秒的速度双向运行。它还具有 96GB 的 HBM3 并汇集了不同类型的 CPU 和 GPU 内存。
非正式 GH200 分析
研究人员获得了正在升级的阿尔卑斯超级计算机中 GH200 芯片的一个分区