英伟达宣布推出NVLink Fusion技术,允许客户定制CPU与AI加速器与其产品协同工作。在台北国际电脑展2025上,英伟达发布了聚焦数据中心和企业级AI的一系列创新,其中最重磅的是全新NVLink Fusion计划。该计划允许客户及合作伙伴在定制化机架级系统设计中采用其核心NVLink技术,使系统架构师能够在英伟达的机架级架构中将第三方CPU或加速器与其产品协同使用,从而开辟新的可能性。
英伟达已为该计划汇聚了多家合作伙伴:高通与富士通将在其CPU中集成该技术。NVLink Fusion还将扩展至定制AI加速器领域,因此英伟达引入了包括Marvell、联发科在内的多家芯片合作伙伴,以及芯片设计软件公司新思科技和楷登电子加入NVLink Fusion生态系统。
作为确保英伟达在AI工作负载领域统治地位的核心技术之一,NVLink通过突破AI服务器中GPU与CPU间通信速度这一制约扩展性的关键瓶颈,显著提升了峰值性能与能效。这项专有互连技术支持GPU-GPU和CPU-GPU直接通信,虽然沿用成熟的PCIe电气接口,但其带宽较标准PCIe接口最高可达14倍,延迟表现也更为优异。历经多代产品迭代,英伟达通过引入定制NVLink Switch芯片,成功将NVLink的应用范围从单服务器节点扩展至机架级架构,使大规模GPU集群能够并行处理AI工作负载。这一技术优势成为AMD、博通等竞争对手难以企及的关键壁垒。
尽管NVLink是专有接口,但英伟达此前主要将该技术限定于自有芯片产品。2022年,英伟达曾开放其C2C(芯片到芯片)互连技术,允许第三方芯片通过行业标准Arm AMBA CHI和CXL协议与英伟达GPU通信。而此次推出的NVLink Fusion计划具有更广泛的适用性,通过NVLink连接支持机架级架构中的横向扩展和纵向扩展应用。
目前,IBM是唯一与英伟达达成此类授权的CPU厂商。双方曾合作开发基于Power9处理器与"Volta" V100 GPU加速器的准百亿亿次系统,通过NVLink 2.0端口连接。IBM自研的"BlueLink" OpenCAPI物理层及NUMA协议,与NVLink协议的整合为田纳西州橡树岭国家实验室"Summit"及劳伦斯利弗莫尔国家实验室"Sierra"超算奠定了基础。
英伟达"Grace" CG100 Arm服务器处理器内置NVLink端口,通过链路聚合实现与"Hopper" H100/H200及"Blackwell" B100/B200/B300 GPU加速器间单端口600 GB/s的总带宽。NVLink技术规格演进如下:
**●NVLink 1.0:**单通道20 Gb/s,8通道/链路,双向带宽40 GB/s。Pascal P100配备4个链路,GPU间及与实验性NVLink 1.0端口的Power8 CPU间总带宽达160 GB/s。
**●NVLink 2.0:**单通道25 Gb/s(与IBM BlueLink相同),8通道/链路,双向带宽50 GB/s。V100 GPU集成6个链路,设备间总带宽300 GB/s。
**●NVLink 3.0:**引入PAM-4调制使通道带宽翻倍,通道数减半至4/链路,保持50 GB/s双向带宽。“Ampere” A100 GPU配备12个NVLink 3.0端口,总带宽600 GB/s(与Grace CPU相同)。
**●NVLink 4.0:**信号速率提升至100 Gb/s(原生50 Gb/s+PAM-4编码),2通道/链路维持50 GB/s双向带宽。Hopper与Blackwell芯片/芯粒各集成18个链路,单芯粒带宽达900 GB/s(Blackwell封装含双芯粒,总带宽1.8 TB/s)。
值得注意的是,UALink通过聚合更多通道与链路可提升加速器与CPU间带宽。其通道速率达200 Gb/s(原生100 Gb/s+PAM-4编码),4通道/链路实现800 Gb/s单向(1.6 Tb/s双向)带宽。聚合4个链路可构建800 GB/s端口,接近NVLink 4.0在Hopper/Blackwell上实现的900 GB/s。
需明确的是,NVLink Fusion并非全面开放NVLink/NVSwitch技术,也未允许随意集成NVLink内存原子操作。其授权仅限两种场景:
**1.定制CPU集成NVLink端口:**适用于自研CPU的云服务商,通过NVLink连接英伟达GPU加速器。从公开架构图看,系统需整合Spectrum-X交换器、BlueField/ConnectX网卡(负责东西向/南北向网络)、NVSwitch互连及Mission Control系统管理软件,但强制要求尚不明确。
**2.定制加速器与英伟达CPU直连:**采用英伟达Grace CG100或未来"Vera" CV100 CPU,通过NVLink C2C芯粒互连对接含NVLink Fusion端口的加速器。同样需集成Spectrum-X、BlueField/ConnectX网络及NVSwitch、Mission Control组件,但具体强制条件未披露。
当前授权明确排除以下场景:自定义CPU与加速器通过NVSwitch互连;直接构建超级芯片或2/4/8加速器全互联架构。
NVLink Fusion实现了范式突破:富士通与高通将能通过该接口连接其自研CPU,从而释放新的系统设计潜力。该功能通过集成在计算封装旁的小芯片实现。英伟达还纳入了联发科、Marvell和Alchip等厂商的定制ASIC加速器,使其能够与英伟达Grace CPU协同工作。Astera Labs也加入该生态系统,预计将提供专用NVLink Fusion互连芯片。新思科技与楷登电子则为该计划提供全套设计工具和IP支持。
近期确认将推出自研服务器CPU的高通,虽未公布细节,但通过加入NVLink生态系统,其新品将深度融入英伟达快速扩张的AI生态。富士通则致力于推出搭载144核、在内存上采用3D堆叠CPU核心的Monaka处理器。"我们的2纳米Arm架构CPU FUJITSU-MONAKA旨在实现极致能效。将其直接对接英伟达架构,标志着我们在推动AI演进愿景中迈出了重要一步,这将开创可扩展、自主可控且可持续的AI系统新纪元。"富士通CTO Vivek Mahajan表示。
值得注意的是,竞争对手博通、AMD和英特尔均未出现在NVLink Fusion生态名单中。这些企业与众多厂商共同组建了"超加速器链接"(UALink)联盟,致力于开发开放行业标准互连技术以抗衡NVLink,推动机架级互连技术民主化。