Arm平台为AI创新奠定基石

文章探讨了AI算力需求的爆炸性增长推动了新一代基础设施的构建,Arm平台凭借高性能、灵活性和强大的生态系统成为AI应用的基石。ArmNeoverseCSS的更新展示了Arm在AI基础设施领域的领导地位,通过定制芯片和芯粒系统架构支持AI的广泛应用和成本优化。
摘要由CSDN通过智能技术生成

46358d78f43cdad1198411ef6c466332.jpeg

文生视频大模型Sora的发布,又一次将AI算力之争推上了风口浪尖。有统计数据显示,在过去4年中,AI算力的需求增长超过15万倍。就在“百模大战”激战正酣之时,算力基础设施之间的比拼也在不断加剧


有专家指出,在AI 2.0时代,需要新一代的基础设施来支撑大模型的训练推理以及生成式AI应用的规模化落地。传统的计算基础设施已经无法满足大模型、生成式AI的新要求,从计算、存储、网络到数据服务等,AI基础设施的各个核心要素都需要进行重构,而非简单的硬件堆叠。

从芯片厂商到计算设备厂商,乃至云服务商,都在加大对AI基础设施的投入力度,各地的智算中心也在拔地而起。AI正应用于教育、就业、制造、医疗、交通等方方面面。“计算正越来越专用化,通用CPU已不能满足需求。在基础设施领域,正持续向更复杂的仓库级计算转型。它不再只关乎芯片、服务器或机架,而是关乎整个数据中心。”Arm高级副总裁兼基础设施事业部总经理Mohamed Awad如是说。

Arm平台会成为运行AI的基石吗?

60920b44e031fa9182d6fe34a0a6de98.jpeg

高性能、灵活性、生态系统
一个也不能少

这已经是事实!众多国际知名的大型科技企业正基于 Arm平台构建新一代系统和基础设施。其中,NVIDIA就是一个很好的例子,该公司推出的Grace Hopper从根本上重新设计了系统架构。从单个CPU管理多个GPU,转变为CPU与GPU一对一的映射,更多的CPU意味着内存一致性,这最终将大大提高GPU的利用率。亚马逊云科技和微软等其他行业巨头也采取了类似的方法,他们正从头开始设计系统,并围绕着定制系统级芯片(SoC)展开。“此方法之所以能发挥巨大作用,是因为这些企业比任何人都更了解自己的工作负载,他们可以自由地对系统的各个方面进行调优,包括网络、加速甚至是通用计算,以优化效率、性能和总体拥有成本(TCO)。”Mohamed Awad解释说,“这些企业选择Arm平台的原因很简单,因为Arm独特的定位能够赋予这些合作伙伴快速创建定制解决方案的能力。同时,Arm借助自身强大的生态系统,基于Arm Neoverse平台为客户和合作伙伴进一步夯实了其AI应用的根基。”

AI的适用范围不仅是应用服务器和数据中心。AI正成为包括网络、安全和存储等在内的诸多领域不可或缺的一部分,覆盖从小型终端到交换机、路由器和基站等各种设备的整个基础设施。经过持续多年的努力,Arm已经在基础设施领域确立了其领先地位。

Mohamed Awad表示,Arm在基础设施领域取得的成功,主要得益于以下三方面因素:首先是卓越性能,Arm的工程团队坚持不懈实现技术和产品的迭代、提升;其次是灵活性,Arm赋能技术合作伙伴开发定制芯片,更好地支持其专用的工作负载和系统;最后是生态系统的壮大,Arm在软件、IP和芯片生态系统中提供出色的产品性能和灵活性,能够加速产品上市。

8b39f0aa6b6ee341ea6173d917dfb319.jpeg

上述三大优势的集中体现就是Arm Neoverse计算子系统(CSS)。它就像是一座桥梁,让企业用户能够更快捷、更方便、更经济地构建自己的基础设施,满足包括AI在内的快速增长的业务需求。业界头部的云服务提供商和初创公司都对Arm Neoverse CSS青睐有加。比如,Microsoft Azure Cobalt CPU便是基于Arm Neoverse CSS打造的;甚至有一合作伙伴通过Neoverse CSS,从项目启动到流片仅耗时九个月。

Mohamed Awad还特别提到了Arm全面设计(Arm Total Design)生态项目,它就是以Arm Neoverse CSS为基础打造的一个生态系统,参与其中的合作伙伴可以高效、无缝地交付基于Arm Neoverse CSS的定制芯片。云豹智能是Arm全面设计生态项目在中国市场的首家合作伙伴。这是一家专注于云计算和数据中心数据处理器芯片(DPU)和解决方案的领先半导体公司,Arm全面设计正帮助云豹智能将业务拓展到其他领域,并有助于其开发其他类型的基础设施系统级芯片(SoC)。

据Mohamed Awad介绍,在推出后短短四个月内,Arm全面设计生态项目已吸引超过20家成员加入。在合作伙伴的协作计划中,他们将一同协作,在三家主要代工厂的先进工艺节点上打造芯片和芯粒设计。基于合作伙伴的反馈,Arm还打造了芯粒系统架构(Chiplet System Architecture, CSA),旨在构建一个功能强大、支持通用计算的芯粒生态系统。

掀开Arm Neoverse旅程新篇章

俗话说,打铁还需自身硬。毕竟高性能的芯片和先进的架构才是最具说服力的。近日,Arm更新了其Neoverse产品路线图,致力于帮助客户和合作伙伴构建基于Arm平台的AI基础设施。

a0ff0d26b8f9b3948744ceb0093dace5.jpeg

此次产品更新的最大亮点是两款基于全新第三代 Neoverse IP构建的Arm Neoverse CSS:其一,最新的Arm Neoverse CSS V3是高性能V系列产品组合中的首款 Neoverse CSS产品,它与CSS N2相比,单芯片性能可提高50%;其二,最新的Arm Neoverse CSS N3拓展了Arm领先的N系列CSS产品路线图,它与CSS N2相比,每瓦性能可提升20%。

“以新产品的推出为标志,我们掀开了Arm Neoverse旅程的新篇章。”Mohamed Awad表示,“基于新的Arm Neoverse CSS V3和Arm Neoverse CSS N3,我们将专注于释放芯粒等新技术的潜力,并更大限度地优化实际工作负载的TCO。这对于整个生态系统的发展至关重要。”

去年,Arm推出了Neoverse CSS,使得定制芯片变得容易也更迅速。在Neoverse CSS中,Arm负责配置、优化和验证一套完整的计算子系统,并针对基础设施市场的各种关键用例进行配置,使得合作伙伴能够专注于针对特定系统级工作负载,塑造其差异化竞争优势,比如软件调优、定制加速等。此外,客户和合作伙伴还能从Neoverse CSS中额外获得选购优势,从而加快产品上市速度、降低工程成本。Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示:“我们之所以创建Neoverse CSS项目,目的就是为了让客户能够像管理他们自己的软件和系统栈一样地管理芯片栈。”

以Neoverse CSS为纽带,Arm与合作伙伴之间相互促进、共同提高,在保持平台先进性的同时,让定制芯片开发更高效,也更接地气。

Dermot O’Driscoll举例说,Neoverse CSS N3聚焦能效,新的N系列产品引入了Armv9.2功能,可为每个核心提供2MB的专用L2缓存,并支持最新的PCIe和CXL I/O标准,以及UCIe芯粒标准,很好地满足基础设施对高性能的要求。Neoverse CSS N3的首个实例可提供32核,热设计功耗(TDP)低至40W;同时,其可扩展性也非常好,能够覆盖电信、网络和DPU等一系列应用,并能很好地支持云的横向扩展。

Arm Neoverse CSS V3同样“身手矫捷”,在单芯片上最多可扩展至128核,并支持最新的高速内存和I/O标准,Neoverse CSS V3 基于Arm新的 Neoverse V3 核心打造,这是Arm目前单线程性能最高的Neoverse核心。

Dermot O’Driscoll表示:“Neoverse CSS是专为帮助客户在基于Arm领先的CPU平台上,快速打造通用计算芯粒而推出的产品。它能为客户提供所需的所有接口,以便与客户自身的加速器进行完美耦合。这种方法保证了在需要CPU时提供CPU,在需要AI加速器时提供AI加速器,两全其美。”

Neoverse CSS V3和Neoverse CSS N3的推出代表Arm的新里程碑。CSS代表着Arm向客户交付产品的方式有了跃升的改变。这样的变化并不仅限于Arm的产品,也延伸到了其首屈一指的软硬件生态系统。

8f1758904207996eca7f26b8162aaf64.jpeg

“生态+平台”走向未来

AI时代,算力需求的持续增长是不争的事实。对于基础设施厂商来说,提供高性能算力的同时,还要注意成本和能源等方面的限制。这就要求在基础设施层面,乃至整个数据中心里,实现自上而下的优化。为软件工作负载量身打造定制芯片的需求正是由此而生。Neoverse CSS V3和Neoverse CSS N3是实现定制与优化,并保证灵活性的最佳载体。Dermot O’Driscoll相信,这些新的计算子系统能够帮助合作伙伴构建领先的高性能且高效的服务器芯片,满足持续增长的算力需求。

Arm最独特的优势之一,就是赋能广泛的生态系统进行创新。聚焦Arm Neoverse,Arm未来可以通过诸如Bfloat16、MatMul、SVE和SVE2等架构功能,以及微架构的优化,持续提升运行在CPU上的机器学习(ML)计算的表现;通过支持最新的行业标准接口,以及提供用于一致性高带宽连接的CHI协议,为定制AI加速器与Arm Neoverse平台和Arm Neoverse CSS的紧耦合提供无与伦比的灵活性;同时,还可为自研定制AI加速器的合作伙伴提供Arm行业领先的系统互连技术,以实现与主机计算的紧密耦合链接,并提供CPU来处理AI工作的编排,支持利用Arm基础设施软件生态系统的云原生软件。

AI,未来已来!Arm独特的“生态+平台”的模式,将让更多基础设施和数据中心受益。

往/期/回/顾

ARM处理器的前途

一台ARM服务器“一朵云”,ZStack真的做到了

从科技赋能到价值引领,东莞证券可进化的信创云建设启示录

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值