NVLink Fusion破局：英伟达授权CPU/加速器厂商，硬刚UALink联盟_nvinvidia nvlink fusion包含哪些芯片-CSDN博客

本文链接：https://blog.csdn.net/weixin_50197960/article/details/148088024

英伟达宣布推出NVLink Fusion技术，允许客户定制CPU与AI加速器与其产品协同工作。在台北国际电脑展2025上，英伟达发布了聚焦数据中心和企业级AI的一系列创新，其中最重磅的是全新NVLink Fusion计划。该计划允许客户及合作伙伴在定制化机架级系统设计中采用其核心NVLink技术，使系统架构师能够在英伟达的机架级架构中将第三方CPU或加速器与其产品协同使用，从而开辟新的可能性。
在这里插入图片描述
英伟达已为该计划汇聚了多家合作伙伴：高通与富士通将在其CPU中集成该技术。NVLink Fusion还将扩展至定制AI加速器领域，因此英伟达引入了包括Marvell、联发科在内的多家芯片合作伙伴，以及芯片设计软件公司新思科技和楷登电子加入NVLink Fusion生态系统。

作为确保英伟达在AI工作负载领域统治地位的核心技术之一，NVLink通过突破AI服务器中GPU与CPU间通信速度这一制约扩展性的关键瓶颈，显著提升了峰值性能与能效。这项专有互连技术支持GPU-GPU和CPU-GPU直接通信，虽然沿用成熟的PCIe电气接口，但其带宽较标准PCIe接口最高可达14倍，延迟表现也更为优异。历经多代产品迭代，英伟达通过引入定制NVLink Switch芯片，成功将NVLink的应用范围从单服务器节点扩展至机架级架构，使大规模GPU集群能够并行处理AI工作负载。这一技术优势成为AMD、博通等竞争对手难以企及的关键壁垒。

尽管NVLink是专有接口，但英伟达此前主要将该技术限定于自有芯片产品。2022年，英伟达曾开放其C2C（芯片到芯片）互连技术，允许第三方芯片通过行业标准Arm AMBA CHI和CXL协议与英伟达GPU通信。而此次推出的NVLink Fusion计划具有更广泛的适用性，通过NVLink连接支持机架级架构中的横向扩展和纵向扩展应用。

目前，IBM是唯一与英伟达达成此类授权的CPU厂商。双方曾合作开发基于Power9处理器与"Volta" V100 GPU加速器的准百亿亿次系统，通过NVLink 2.0端口连接。IBM自研的"BlueLink" OpenCAPI物理层及NUMA协议，与NVLink协议的整合为田纳西州橡树岭国家实验室"Summit"及劳伦斯利弗莫尔国家实验室"Sierra"超算奠定了基础。

英伟达"Grace" CG100 Arm服务器处理器内置NVLink端口，通过链路聚合实现与"Hopper" H100/H200及"Blackwell" B100/B200/B300 GPU加速器间单端口600 GB/s的总带宽。NVLink技术规格演进如下：

**●NVLink 1.0：**单通道20 Gb/s，8通道/链路，双向带宽40 GB/s。Pascal P100配备4个链路，GPU间及与实验性NVLink 1.0端口的Power8 CPU间总带宽达160 GB/s。

**●NVLink 2.0：**单通道25 Gb/s（与IBM BlueLink相同），8通道/链路，双向带宽50 GB/s。V100 GPU集成6个链路，设备间总带宽300 GB/s。

**●NVLink 3.0：**引入PAM-4调制使通道带宽翻倍，通道数减半至4/链路，保持50 GB/s双向带宽。“Ampere” A100 GPU配备12个NVLink 3.0端口，总带宽600 GB/s（与Grace CPU相同）。

**●NVLink 4.0：**信号速率提升至100 Gb/s（原生50 Gb/s+PAM-4编码），2通道/链路维持50 GB/s双向带宽。Hopper与Blackwell芯片/芯粒各集成18个链路，单芯粒带宽达900 GB/s（Blackwell封装含双芯粒，总带宽1.8 TB/s）。
在这里插入图片描述
值得注意的是，UALink通过聚合更多通道与链路可提升加速器与CPU间带宽。其通道速率达200 Gb/s（原生100 Gb/s+PAM-4编码），4通道/链路实现800 Gb/s单向（1.6 Tb/s双向）带宽。聚合4个链路可构建800 GB/s端口，接近NVLink 4.0在Hopper/Blackwell上实现的900 GB/s。

需明确的是，NVLink Fusion并非全面开放NVLink/NVSwitch技术，也未允许随意集成NVLink内存原子操作。其授权仅限两种场景：

**1.定制CPU集成NVLink端口：**适用于自研CPU的云服务商，通过NVLink连接英伟达GPU加速器。从公开架构图看，系统需整合Spectrum-X交换器、BlueField/ConnectX网卡（负责东西向/南北向网络）、NVSwitch互连及Mission Control系统管理软件，但强制要求尚不明确。

**2.定制加速器与英伟达CPU直连：**采用英伟达Grace CG100或未来"Vera" CV100 CPU，通过NVLink C2C芯粒互连对接含NVLink Fusion端口的加速器。同样需集成Spectrum-X、BlueField/ConnectX网络及NVSwitch、Mission Control组件，但具体强制条件未披露。

当前授权明确排除以下场景：自定义CPU与加速器通过NVSwitch互连；直接构建超级芯片或2/4/8加速器全互联架构。
在这里插入图片描述
NVLink Fusion实现了范式突破：富士通与高通将能通过该接口连接其自研CPU，从而释放新的系统设计潜力。该功能通过集成在计算封装旁的小芯片实现。英伟达还纳入了联发科、Marvell和Alchip等厂商的定制ASIC加速器，使其能够与英伟达Grace CPU协同工作。Astera Labs也加入该生态系统，预计将提供专用NVLink Fusion互连芯片。新思科技与楷登电子则为该计划提供全套设计工具和IP支持。

近期确认将推出自研服务器CPU的高通，虽未公布细节，但通过加入NVLink生态系统，其新品将深度融入英伟达快速扩张的AI生态。富士通则致力于推出搭载144核、在内存上采用3D堆叠CPU核心的Monaka处理器。"我们的2纳米Arm架构CPU FUJITSU-MONAKA旨在实现极致能效。将其直接对接英伟达架构，标志着我们在推动AI演进愿景中迈出了重要一步，这将开创可扩展、自主可控且可持续的AI系统新纪元。"富士通CTO Vivek Mahajan表示。

值得注意的是，竞争对手博通、AMD和英特尔均未出现在NVLink Fusion生态名单中。这些企业与众多厂商共同组建了"超加速器链接"(UALink)联盟，致力于开发开放行业标准互连技术以抗衡NVLink，推动机架级互连技术民主化。