【观察】定义AI时代数据中心网络,华为CloudEngine用速度跑出新高度

640?wx_fmt=jpeg

申耀的科技观察

读懂科技,赢取未来!

640?wx_fmt=jpeg 640?wx_fmt=jpeg 640?wx_fmt=jpeg 640?wx_fmt=jpeg


毫无疑问,随着数据量变得越来越庞大,以及计算能力的不断提升,智能算法的快速突破,再加上云计算、大数据、物联网和人工智能等新技术在传统产业更密集的渗透,如今的世界正在以加速度进入到智能化时代,即“物理世界信息化、信息世界智能化。”


但是,面对全新的AI新时代,相比业界在算力、算法乃至存储介质等领域的突破,目前传统数据中心网络无论是性能、带宽乃至运维能力方面,都存在各种各样的问题,也正日益成为影响AI商用进程的关键瓶颈。


640?wx_fmt=jpeg


在此背景下,华为率先发布了面向AI时代的智能无损数据中心网络AI Fabric,并推出了业界首款面向AI时代的数据中心核心交换机CloudEngine 16800,通过内嵌AI芯片、支持单槽48 x 400GE高密端口、使能自动驾驶网络三大全新特性,为数据中心从云时代向AI时代的演进提供了关键的支撑力。


而在这背后,华为不仅以前所未有的前瞻力和爆发力,更以全新的速度跑出了全新的高度,在重新定义了AI时代数据中心交换机的同时,也真正引领了整个数据中心网络在AI时代的进化与迭代。


以全新的速度跑出新高度


根据华为GIV 2025的预测,到2025年全球新增数据量将达到180ZB,远超过人类处理能力,95%的数据将依赖AI处理;届时企业对AI的采用率也将从2015年的16%增至86%,可以说AI成为企业重塑商业模式、提升客户体验和开创未来的关键推动力。


所以,为了提升AI算力,业界在计算和存储领域已实现了性能的提速升级。但传统数据中心网络目前面临的三大挑战,却成为了AI算力提升的关键瓶颈。


包括:传统以太网无法有效消除丢包,即使是0.1%的丢包率都将造成数据中心算力下降50%;同时,数据量的不断猛增,现有100GE为主的数据中心网络已无法支撑数字洪水的挑战;此外,随着计算网络、存储网络和数据网络的逐渐融合,靠传统人工排查的运维手段定位故障需要数个小时,这种模式显然已“难以为继”。


640?wx_fmt=png


为此,华为发布了业界首款面向AI时代的数据中心交换机CloudEngine 16800,以全新的三大特性,打造出了AI时代智能无损的数据中心网络,具体来看:


第一,内置AI芯片,使能网络0丢包,时延最高可降低了44.3%。CloudEngine 16800提供高密400GE线卡,交换能力高达业界平均的5倍,满足AI时代流量倍增需求;通过内置的AI芯片,CloudEngine交换机可对网络流量模型智能分析,使能网络同时实现0丢包、低时延和高吞吐。


数据显示,由CloudEngine交换机构建的AI Fabric智能无损数据中心网络方案已通过欧洲权威测试机构EANTC高性能数据中心测试,时延最高可降低44.3%。


第二,独创智能算法集,AI运行效率高于业界30%。华为CloudEngine数据中心交换机加持iLossless智能算法,基于独创的动态ECN(Explicit Congestion Notification)、VIQ(Virtual Input Queue)、Fast CNP(Fast Congestion Feedback)全局调优,实现网络最高性能与应用最优体验。


同样,在权威第三方评测机构Tolly Group开展的比拼测试中,由CloudEngine构建的AI Fabric智能无损数据中心网络方案在HPC(高性能计算)、分布式AI训练、分布式存储三大场景下,性能全面领先业界友商。


第三,是实现计算、存储、数据三网融合,TCO整体降低53%。传统数据中心需要分别部署三张网络:基于IB(InfiniBand)的HPC(高性能计算)网络,基于FC(Fibre Channel)的SAN(存储网络),以及以太架构的LAN(交换网络)。前两张专网需要专人运维,成本高昂。因此,华为CloudEngine数据中心交换机通过内置的人工智能芯片和智能算法,打造数据交换零丢包的融合以太网络,100%释放算力,实现三网合一,整体降低TCO达53%。


不难看出,无论是时延、性能、TCO,华为CloudEngine数据中心交换机都以全新的数据刷新了业界的记录,真正用速度跑出了全新的高度,重新定义了数据中心网络代际切换的新标准,也助力了客户使能和加速AI的商用进程。


跑分让技术实力傲视群雄


正所谓“口说无凭,跑分为证”。实际上,上文提到的由CloudEngine交换机构建的AI Fabric智能无损数据中心网络方案一系列的领先数据,都是建立在第三方测试机构的“跑分”基础之上的。特别是对数据中心网络交换机而言,欧洲高级网络测试中心(简称EANTC)就是其“跑分”的最佳舞台。


640?wx_fmt=png


众所周知,EANTC是全球领先的电信领域第三方独立的权威测试机构之一,总部位于德国柏林,自1991年起为全球领先的网络设备提供商、一级电信运营商以及全球的大企业和政府,提供厂商中立的咨询服务和真实可复现的高质量测试服务。


EANTC在高性能计算(HPC)和分布式存储场景下,基于100GbE和25GbE的测试组网,对华为智能无损以太网络的吞吐率、丢包率和时延等重要网络性能进行测试,其测试结果如下:


在高性能计算(HPC)场景下,华为AI Fabric 解决方案可降低消息时延:超大包的时延降低了44%;在分布式文件系统(DFS)场景下,对于I/O 深度值较大的消息,华为AI Fabric 解决方案可使时延降低多达15%;同时,通过基于融合以太网的 RDMA(RoCE)的实现,华为AI Fabric解决方案实现了无损、弹性的传输。


基于此,EANTC给出的最后结论是:“华为AI Fabric支持无丢包的数据传输和文件存储,高效地处理时延敏感的应用程序。在HPC和DFS基准测试中,华为AI Fabric在启用动态ECN时成功处理了数据中心混合流量,平均网络时延降低符合预期。此外,该解决方案对网络链路故障具有良好的恢复能力。”


不仅如此,AI Fabric所体现的创新与价值,也得到国际权威测试机构Tolly Group的高度认可。在其进行的对比测试验证结果表明,华为AI Fabric由CloudEngine系列数据中心交换机组网,相比业界其他主流厂商的组网方案,性能表现卓越,优于Tolly进行的对比测试验证的思科同等款型交换机的相同组网。


其中,在分布式AI训练场景中,华为AI Fabric方案的AI训练效率比思科方案高27.5%;在高性能计算(HPC)场景中,华为AI Fabric方案的任务完成效率比思科优29.8%;而在分布式存储场景中,华为AI Fabric方案的存储性能也比思科优30.5%以上。


所以,Tolly最终给出的结论是:“华为和思科的方案均基于RDMA over Converged Ethernet (RoCEv2)。但在所有三大场景中,华为AI Fabric解决方案的性能均优于思科。”


由此可见,无论是EANTC、还是Tolly的测试结果,本身就是技术创新的一块“试金石”。而华为敢于参加测试,敢于公布“跑分”成绩,这背后其实也是华为对AI Fabric解决方案技术实力的自信,而这种强大的技术实力也让华为AI Fabric解决方案在AI时代做到了“傲视群雄”。


数据中心网络迈入AI时代


总的来说,华为抓住AI时代数据中心RDMA代际切换机遇,创新地打造了以CloudEngine为核心的下一代智能无损的数据中心网络解决方案AI Fabric,依靠两级AI智能芯片和独特的智能拥塞调度算法,实现RDMA业务流的零丢包、高吞吐和超低时延,加速AI时代的计算和存储效率,最终让企业客户获得了专网的性能、以太网的价格,整体ROI达到45倍,为未来企业客户构建一个统一、融合、高效的数据中心网络奠定了坚实的基础。


640?wx_fmt=jpeg


值得一提的是,在华为AI Fabric的推动下,如今越来越多的客户成功实现了数据中心网络的升级和迭代。例如,某互联网巨头布局无人驾驶,但无人驾驶的技能训练涉及到大量的AI计算,其一天采集的数据,需要几百的GPU服务器7天才能训练完,严重影响了无人驾驶的上市时间。而通过华为CloudEngine交换机提供的0丢包、低延时,高吞吐的智能无损以太网络,最终使得整体训练的时长缩短40%,加速了无人驾驶训练的速度。


此外,某大型商业银行进行云战略创新试点,为了能够给用户提供访问像本地盘一样的使用体验,采用RDMA技术提升网络吞吐并降低CPU的消耗。在此过程中,华为CloudEngine交换机智能拥塞调度实现了网络的0丢包、低延时和高吞吐,加速了RDMA通信,经实测最终存储集群IOPS性能提升了20%,单卷性能达到35万。


除此之外,华为同样也受到了权威第三方机构的一致认可。今年4月,华为CloudEngine交换机从众多竞争者中脱颖而出,获得了Gartner Peer Insights数据中心网络“客户之选(Customers’ Choice)”的称号,使之成为获得该项荣誉的唯一一家非北美厂商。


同时,IDC最新的数据中心交换机跟踪报告显示,华为CloudEngine以领先的市场份额摘取了2018年中国市场的桂冠,这也是其自2016年以来连续第三年获得中国市场份额第一的殊荣。此外,华为CloudEngine也被Forrester评为数据中心SDN硬件平台领导者。


综上所述,内嵌高性能AI芯片和独创的iLossless智能无损交换算法,让华为CloudEngine系列交换机,以及华为AI Fabric智能无损数据中心网络解决方案实现了全方位的创新,由此带来的“更快、更高、更强”的综合实力,无疑也让华为对整个网络交换机市场,乃至全球数据中心网络未来的格局都将起到重塑的作用,同时也将引领整个数据中心网络市场进入AI新时代。


640?wx_fmt=gif


申耀的科技观察,由科技与汽车跨界媒体人申斯基(微信号:shenyao)创办,16年媒体工作经验,拥有中美两地16万公里自驾经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。


640?wx_fmt=jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值