过去10年来,AI取得了巨大的进展,成为不可忽略的发展主题。AI for science的提出将科学研究的范式进一步革新,进入了AI+HPC+大模型的时代,而科学计算的发展伴随着计算硬件的发展。在同一个算法体系下,更强大的算力、更高效的算力利用,意味着精度更高、时空维度更大、体系更复杂的模型。而算力的发展来源于CPU和GPU异构结合。我们也能从最近举办的Computex 2024,窥见目前主流的算力硬件厂商未来的发展方向:Nvidia,AMD主要推进GPUs,Intel则更专注提升X86的能效。以下是主要内容:
Nvidia GPUs
Nvidia首席执行官黄仁勋概述了公司到2027年发展路线图。
-
2024年Blackwell 即将上市,将用于 Nvidia 的 DGX 风冷和液冷系统。风冷系统将与 x86 CPU 搭配使用。
NVIDIA 创始人兼首席执行官黄仁勋展示 Blackwell 的生产版本。(来源:Nvidia)
-
2025年将推出Blackwell Ultra GPU,这是2024年的Blackwell GPU的升级版。将支持HBM3w,以及800GB/sec的X800网络接口。
-
路线图中2026年新增了GPU、CPU和网络芯片。2026年推出一个名为 “Rubin”的新的GPU平台,可以支持HBM4内存,这需要密集的内存配置。Rubin GPU将支持12插槽服务器,而目前仅支持8插槽服务器。除此之外也在升级整个芯片堆栈,同年也将计划推出一款名为Vera的新CPU,与Rubin搭配使用。同时Vera也将取代目前Grace CPU(2023年上市,与Hopper 和BlackWell GPU搭配使用)。网络设备方面,Nvidia还将推出NVlink6 互联,用于连接机架和数据中心的GPU。路线图显示,其速度将达到3600GB/sec,较目前位于Blackwell Platform的NVlink5的1800GB/sec的速度快两倍。Rubin Platform也将网络速度翻倍,将数据中心间的GPU通信扩展到1600GB/sec,是前代产品的两倍。CX9 SuperNIC网络接口和x1600以太网/IB网络接口将允许数百万个GPU进行通信。
-
2027年,公司将计划推出增量升级Rubin Ultra,同样采用HBM4。
黄仁勋在Computex 2024上演讲表示“我们公司以一年为节奏,我们的基本理念非常简单:按一年的节奏构建整个数据中心规模,然后将其分解并出售给您”
AMD GPU
AMD首席执行官Lisa Su在宣布新的GPU时直言不讳的批评了Nvidia。AMD的MI300大获成功,微软、Meta(原facebook)和Oracle Cloud正在采用这款产品。微软首席执行官Satya Nadella表示,MI300x为GPT-4工作负载提供了最佳的性价比。
AMD下一个主要GPU将是MI325X,他是MI300X的升级版,将于今年年底推出。它将包含288GB HBM3E内存和每秒6TB的内存带宽。
AMD 首席执行官Lisa Su表示“配备八个MI325加速器的单个服务器可以运行高达1万亿个参数的高级模型。这是H200服务器支持的规模的两倍”。
2025年,AMD将发布MI350系列,同样基于HBM3e,采用3nm工艺制造,GPU基于全新CDNA-4架构,针对AI进行了调优。Lisa Su表示“MI300是我们推出的CDNA-3,AI性能比上一代提高了8倍,而有了CDNA-4,我们有望实现35倍的提升”
Lisa Su说“MI325X和MI320X系列将支持通用基板OCP服务器涉及,意味着我们的客户可以非常快速地采用这项新技术”。相比之下,普通客户并不容易买到现成的Nvidia GPU。2026年,AMD将推出MI400GPU,尽管Lisa Su并没有谈论太多,只是说它将基于CDNA-Next架构。
AMD还将推出了代号为Turin的全新第五代Epyc CPU,CPU将采用3nm和6nm芯片,将于2024年下半年推出。他将拥有多达192个内核和384个线程。
AMD声称他们在关键AI工作负载方面比英特尔竞争对手的当前一代Xeon芯片快5.4倍。
Intel Chips
在本次主题演讲中,Intel’s CEO Pat Gelsinger一如既往地诚实,重点介绍了代号为Sierra Forest的Xeon 6E服务器芯片和Lunar PC芯片。没有GPU,也没有宏大的宣言。Gelsinger表示,Intel正在凭借新一代服务器和PC芯片重返CPU市场,这些芯片在保持性能领先地位的同时,功耗更低。
Xeon 6 E核芯片面向具有大量CPU核心的节能服务器,Xeon 6E核芯片有多种配置,最多可以配置288个内核。这些芯片在Serve The Home 和Phoronix上获得了极高的评价。(这两个网站上有很多在多种工作负载核操作系统上测试硬件方面经验丰富,值得信赖的评论员)他们总体的评价是:X86芯片能够以不错的能效提供出色的性能。
英特尔推出配备高效核心 (E 核心) 的 Xeon 6 处理器,该处理器功耗更低,占用机架空间更小。(来源:英特尔公司)
Gelsinger说“我们认为现代数据中心一项必不可少的升级,具有高核心数、高密度和出色的每瓦的性能。并且Xeon 6 E是我们在Intel 3 上推出的第一款产品,而Intel 3是我们四年来五个节点的第三个。同时 代号为“Granite Rapids 的带有 P 核(性能核)的 Xeon 3 芯片也正在研发中,将于2024年晚些时间发布”。
除了服务器芯片之外,Intel的Lunar Lake PC芯片打破了X86耗电的刻板印象, Lunar Lake这种全新的SOC架构和设计提供了前所未有的能效,功耗相较Meteor Lake 低40%,能效比上一代Meteor Lake PC芯片高出40%。打破了X86无法在能效上取胜的神话。
总的来看,对于Nvidia和AMD来看,AI是一个金矿, 两家公司通过2026年的产品扩展了他们的GPU和CPU路线图,Intel的GPU路线图处于生命维持状态,Intel的 Ponte Vecchio GPU已经正式死亡,而其Falcon ShoresGPU则通过重新设计而复活。Intel转而专注于其新款Xeon 6 E-core芯片,该芯片因出人意料的能效提升而获得好评。
内容引用自:https://www.hpcwire.com/2024/06/05/computex-2024-nvidia-amd-push-gpus-intel-revs-up-x86-power-efficiency/