第 64 版 TOP500 榜单显示,El Capitan 已夺得榜首位置,成为继 Frontier 和 Aurora 之后第三个达到E级计算能力的系统。此后,这两个系统分别跌至第 2 位和第 3位。
美国加利福尼亚州劳伦斯利弗莫尔国家实验室的全新 El Capitan 系统首次亮相,成为性能最强大的系统,HPL 得分为 1.742 EFlop/s。该系统拥有 11,039,616 个 CPU 和 GPU 核心,基于 AMD 第四代 EPYC 处理器,24 个核心,频率为 1.8GHz,配备 AMD Instinct MI300A 加速器。El Capitan 依靠 Cray Slingshot 11 网络进行数据传输,能效达到 58.89 Gigaflops/watt。这一能效等级也帮助 El Capitan 在 GREEN500 榜单上名列第 18 位。
美国田纳西州橡树岭国家实验室的 Frontier 系统已升至第二位。其 HPL 得分从上一榜单上的 1.206 Eflop/s 提升至本榜单上的 1.353 Eflop/s。Frontier 的总核心数也从上一榜单上的 8,699,904 个核心增加至本榜单上的 9,066,176 个核心。其数据传输依赖于 Cray Slingshot-11 网络。
位于美国伊利诺伊州阿贡领导力计算中心的 Aurora 系统在这份 TOP500 榜单中排名第三。该机器保持了上一份榜单的 HPL 基准测试得分,达到了 1.012 Exaflop/s。Aurora 由英特尔基于 HPE Cray EX – Intel Exascale Compute 刀片构建,该刀片使用英特尔至强 CPU Max 系列处理器和英特尔数据中心 GPU Max 系列加速器,通过 Cray 的 Slingshot-11 网络互连进行通信。
安装在美国 Microsoft Azure Cloud 上的 Eagle 系统位居第四,并且仍然是 TOP500 中排名最高的基于云的系统。它的 HPL 得分为 561.2 PFlop/s
排名第五的 HPC6 系统。这台机器安装在意大利费雷拉埃尔博尼奥内的 Eni SpIt 中心,与排名第二的系统 Frontier 具有相同的架构。Eni 的 HPC6 系统实现了 477.90 PFlop/s 的 HPL 基准测试,现在是欧洲最快的系统。
以下是 Top 10 系统的摘要:
中国Top10系统摘要
-
美国加利福尼亚州劳伦斯利弗莫尔国家实验室的 El Capitan 系统成为 TOP500 中新的 No. 1 系统。HPE Cray EX255a 系统在 HPL 基准测试中的测量值为 1.742 Exaflop/s。El Capitan 拥有 11,039,616 个核心,基于 AMD 第四代 EPYC™ 处理器(24 个核心,频率为 1.8 GHz)和 AMD Instinct™ MI300A 加速器。它使用 Cray Slingshot 11 网络进行数据传输,能效达到 58.89 Gigaflops/watt。
-
Frontier 现在是 TOP500 中的第二大系统。这款 HPE Cray EX 系统是美国首个性能超过每秒 1 百亿亿次浮点运算的系统。它安装在美国田纳西州橡树岭国家实验室 (ORNL),由美国能源部 (DOE) 运营。它目前使用 8,699,904 个内核实现了每秒 1.353 百亿亿次浮点运算。HPE Cray EX 架构结合了针对 HPC 和 AI 优化的第三代 AMD EPYC™ CPU、AMD Instinct™ 250X 加速器和 Slingshot-11 互连。
-
Aurora 目前排名第三,初步 HPL 得分为 1.012 Exaflop/s。它安装在美国伊利诺伊州阿贡领导力计算设施,也由美国能源部 (DOE) 运营。这款新的英特尔系统基于 HPE Cray EX – 英特尔百亿亿次计算刀片。它使用英特尔至强 CPU Max 系列处理器、英特尔数据中心 GPU Max 系列加速器和 Slingshot-11 互连。
-
排名第四的系统 Eagle 由微软安装在其 Azure 云中。这款 Microsoft NDv5 系统基于 Xeon Platinum 8480C 处理器和 Nvidia H100 加速器,HPL 得分达到 561 Petaflop/s。
-
排名第五的系统名为 HPC6,安装在意大利费雷拉埃尔博尼奥内的 Eni SpA 中心。这是另一台 HPE Cray EX235a 系统,配备针对 HPC 和 AI 优化的第三代 AMD EPYC™ CPU,以及 AMD Instinct™ 250X 加速器和 Slingshot-11 互连。它实现了 477.9 Petaflop/s。
-
排名第六的系统 Fugaku 安装在日本神户的理化学研究所计算科学中心 (R-CCS)。它拥有 7,630,848 个核心,这使得它的 HPL 基准测试得分达到 442 Petaflop/s。它仍然是 HPCG 基准测试中最快的系统,速度为 16 Teraflop/s。
-
瑞士国家超级计算中心 (CSCS) 的 Alps 系统经过最近的升级,目前排名第七。它是一台 HPE Cray EX254n 系统,配备 NVIDIA Grace 72C 和 NVIDIA GH200 超级芯片以及 Slingshot-11 互连。升级后,其速度达到 434.9 Petaflop/s。
-
LUMI 系统是安装在芬兰 CSC EuroHPC 中心的另一台 HPE Cray EX 系统,其性能为 380 Petaflop/s,位列第八。欧洲高性能计算联合计划 (EuroHPC JU) 正在汇集欧洲资源,开发用于处理大数据的顶级百亿亿次级超级计算机。一台全欧洲准百亿亿次级超级计算机 LUMI 位于芬兰卡亚尼的 CSC 数据中心。
-
9号系统Leonardo安装在意大利CINECA的另一个EuroHPC站点,是一套Atos BullSequana XH2000系统,主处理器为Xeon Platinum 8358 32C 2.6GHz,加速器为NVIDIA A100 SXM4 40 GB,互联为Quad-rail NVIDIA HDR100 Infiniband,HPL性能达到241.2 Petaflop/s。
-
排在前十名的还有新的 Tuolumne 系统,该系统也安装在美国加利福尼亚州的劳伦斯利弗莫尔国家实验室。它是新排名第一的系统 El Capitan 的姊妹系统,具有相同的架构。它本身就达到了 208.1 Petaflop/s 的速度。
TOP500亮点
第 64 版 TOP500 发现,AMD 和英特尔处理器是前 10 名系统的首选。五个系统使用 AMD 处理器(El Capitan、Frontier、HPC6、LUMI 和 Tuolumne),而三个系统使用英特尔(Aurora、Eagle、Leonardo)。Alps 依靠 NVIDIA 处理器,而 Fugaku 拥有专有的基于 ARM 的富士通 A65FX 48c 2.2GHz。
前 10 名中的 7 台计算机使用 Slingshot-11 互连(El Capitan,Frontier,Aurora,HPC6,AlpsLUMI 和 Tuolumne),另外两台计算机使用 Infiniband(Eagle 和 Leonardo)。Fugaku 拥有自己的专有 Tofu 互连。
GREEN500结果
在这一版的 GREEN500 中,除第一名之外,前三名榜单中的新系统都发生了很大变化。
JEDI 再次夺得头把交椅,它是由德国 EuroHPC/FZJ 开发的 JUPITER Exascale 开发仪器。JEDI 在 TOP500 中排名第 224 位,其能效等级与上一榜单相同,为 72.73 GFlops/Watt,HPL 得分为 4.5 PFlop/s。JEDI 是一台 BullSequana XH3000 机器,配备 Grace Hopper Superchip 72c 2GHz、NVIDIA GH200 Superchip、Quad-Rail NVIDIA InfiniBand NDR200,共有 19,584 个核心。
在本届 GREEN500 评选中,法国香槟-阿登 ROMEO HPC 中心的全新 ROMEO-2025 系统位居第二。该系统首次亮相时能效等级为 70.91 GFlops/Watt,HPL 基准为 9.863 PFlop/s。虽然这是一个新系统,但其架构与 JEDI 相同,但大小是 JEDI 的两倍。因此,其能效略低。
排名第三的是法国国家计算机强化设备中心(GENCI-CINES)的新款 Adastra 2 系统。Adastra 2 首次出现在 TOP500 榜单上,其能效得分为 69.10 GFlops/Watt,HPL 得分为 2.529 PFLop/s。这台机器是一台 HPE Cray EX255a 系统,配备 AMD 第四代 EPYC 24 核 1.8GHz 处理器、AMD Instinct MI300A 加速器,总共有16,128 个核心,以及运行 RHEL 的 Slingshot-11。
新的 El Capitan 系统和 Frontier 系统都值得一提。考虑到其最高得分的 HPL 基准测试为 1.742 EFlop/s,该机器还能够以 58.89 Gigaflops/watt 的能效得分夺得 GREEN500 的第 18 名,这相当令人印象深刻。Frontier——上一届 TOP500 榜单的冠军和本榜单的第二名——在 GREEN500 榜单上取得了令人印象深刻的 54.98 Gigaflops/watt 能效得分。这两个系统都表明,在优先考虑能效的同时实现巨大的计算能力是可能的。
HPCG结果
TOP500 榜单纳入了高性能共轭梯度 (HPCG) 基准测试结果,该结果为评估超级计算机性能提供了另一种指标。该分数旨在补充 HPL 测量,以便更全面地了解机器。
-
超级计算机 Fugaku 以 16 PFlop/s 的速度在 HPCG 基准测试中保持领先地位。自 2020 年 6 月以来,它一直保持领先地位。
-
ORNL 的 DOE 系统 Frontier 仍然以 14.05 HPCG-Pflop/s 的速度保持第二的位置。
-
Aurora 系统再次以 5.6 HPCG-petaflops 夺得第三名。
-
El Capitan 尚未有 HPCG 提交。
HPL-MxP结果(HPL-AI)
HPL-MxP 基准测试旨在强调混合精度计算的使用。传统 HPC 使用 64 位浮点计算。如今,我们看到的硬件具有各种级别的浮点精度 - 32 位、16 位甚至 8 位。HPL-MxP 基准测试表明,在计算过程中使用混合精度可以实现更高的性能。通过使用数学技术,与直接使用 64 位精度相比,使用混合精度技术可以计算出相同的精度。
今年 HPL-MxP 类冠军是 Aurora 系统,成绩为 11.6 EFlop/s。第二名是 Frontier,成绩为 11.4;第三名是 LUMI,成绩为 2.35 EFlop/s。
本文仅作翻译分享,无任何商业用途