华为交换机做qos案例_华为自述:做数据中心交换机到底有多难?

本文讲述了华为在研发数据中心交换机CE12800时面临的QoS挑战,包括在二层架构与一层架构的选择、正交架构的实施以及散热和外观设计的问题。华为坚持开放性和客户为中心,最终选择了二层架构,并成功研发出正交架构的CE12800,其设计和性能在业界产生了深远影响。
摘要由CSDN通过智能技术生成

江湖上,总有那么几款经典爆品

人人知道它的名字

却不了解它的故事

正如威镇寰宇的它

华为CE12800数据中心交换机

895a1156aa99911e86755aad37559130.png

看着它们

冷不丁冒出一个问题

2367dbdc9bc82f3726b13f103272d589.png

答案是唯一的

哪怕是华为这样的大牛公司做

也很难!

  到底有多难?

07965df772012ee21b265e78ead0e6c3.png

数据中心交换机真正进入人们的视野,还是2010年。

那一年云计算持续升温,数据中心迎来了大发展,人们发现,一个新的80/20原则诞生了——80%的流量产生在数据中心内部。

也正是从那时起,“东西流量”在业界被广泛提及,数据中心交换机作为处理“东西流量”的神器,引领了整个交换机产业的新一轮增长。

当时的华为,已是运营商网络市场的龙头,正在蓄势进军企业网市场。

要想在企业网市场站稳脚跟,首先就是要占据企业数据中心这个战略高地,而数据中心交换机无疑是攻占这个高地的利器。

转过年来的2011年,华为迎来了一次重大的组织变革,EBG,一个专攻企业级市场的BG成立了,成立之初,管理层便一锤定音:上马数据中心交换机!

2011年4月,华为数据中心交换机正式立项,起个什么样的名字呢?CloudEngine。这个名字包含了两层意思:

①数据中心交换机主要是面向云的,华为要做最好的云网络引擎。

②与华为大名鼎鼎的NE路由器一脉相承,左手NetEngine,右手CloudEngine,包打天下。f5ece11961a5d053bf1bdec0aa8e85b8.png

现在看来,“CloudEngine”这个经典产品能在最恰当的时机立项,既有技术大趋势发展的因素,又有华为内部业务战略的驱动。

总之,外因+内因,就这么踩准了一个点,翻过了一道坎。

c834b3ed4cd79a726fe7e047bf8b4be6.png

大方向定下了,只是万里长征的第一步。

彼时不同今日,7年前,业界对与数据中心网络的技术路线,存在很多争议。最主要的有两大流派:稳健型的“二层派”和颠覆型的“一层派”。

“二层派”的思路是在传统网络架构上进行优化,核心交换机和接入交换机具备独立功能,Spine+Leaf的模式来组网,基于通用的标准协议实现互联互通。

“一层派”的玩法比较激进,裁剪接入交换机的功能,只把它们作为“端口扩展器”,这种“子交换机”不能独立工作,需要一台功能强悍的“母交换机”来配合。“子母”交换机组合起来,变成一台超级交换机,这就是当年很火的“一层架构”。

面对这种“0或1”的选择,华为交换机项目组经历了痛苦的抉择期,一旦架构选错,未来根本就没有机会回头。

当年,“一层派”在业界呼声很高,方案很完美,看起来很有创新性,还有交换机大厂扛旗力挺,芯片厂商和部分客户,也对这种方案很心动。

然而,华为研发经过评估认为,“一层派”这个方案看上去很美,但是意味着“子母”交换机只能使用同一家厂商的方案,这个结构不够开放,会对客户形成绑架。从网络发展的历史看,这不大可能成为主流。

最终,华为选择了“二层”架构,保持系统的开放性,给客户选择权。当然,华为还是留了一手,在架构设计上做了兼容考虑,即便未来“一层”成为主流,华为也能平滑演进。

多年以后,几乎所有的厂商最终都和华为选择了一样的路线,而那种曾经火爆一时的“子母交换机”,早已绝迹江湖。

这种所谓的架构之争,现在已经没有什么争议了,而在当年,对华为交换机团队来说,就是“大是大非”问题。

面对这样的抉择,华为的解决思路是,跳出具体的技术比较,从客户角度思考,把选择权留给客户,把麻烦留给自己。

事实证明,这种“以客户为中心”的思想,很有效。

97a7116fd125b6efb20254145bc14bde.png

在数据中心交换机的硬件设计上,有一道绕不开的坎,叫做“正交架构”。

我们知道,交换机的板卡,主要分为三大类:主控卡、线卡、交换网板。主控卡相当于交换机的大脑,线卡主要提供各种不同速率的端口,而交换网板则提供线卡间高速互联的能力。

如何把这三种板卡“物理的”连在一起呢?需要一个载体,这就是背板,在“正交架构”出现之前,主流的架构是“无源背板”技术。

“扒开”这种交换机瞧一瞧,我们会发现,各种卡都是插在背板上的,大家通过背板这个“中介”,完成彼此的连接和互通。

这种架构是过去的主流,但随着数据中心交换机对速率和扩展性的要求越来越高,弊端就表现出来:要想实现超高速的数据传输,链路要尽可能短,尽量减少中间路径,故障点越少越好。

如果能不绕道长长的背板,而是让线卡和交换网板直接连接,就可以最大限度避免瓶颈。于是,就有了划时代的正交架构↓

73a440c96fe8316263108ea3339bc2ad.gif

拿CE12800举例,所谓正交架构,就是前面的线卡和主控卡横着插,背面的交换网板竖着插,两者相互垂直,板卡相交的地方采用“正交连接器”直接相连,不再通过“漫长”而“坎坷”的背板走线。

这种方式,距离更短、故障点更少,能够搭建起超高速通信的“立交桥”。

对应正交架构,业界还有“非正交”和“伪正交”:

40ad532bdbb2b8f741accd0dfeada8f6.png

传统无源背板架构,所有的板卡,都插在背板上,通过无源铜背板上的走线完成“中介”,更早的时候,还有“有源背板”,即背板上也有芯片,故障率更高,扩展性更差。

伪正交架构,从外面看起来,和正交架构很“高仿”,也是前面横插(竖插),后面竖插(横插) ,前后板卡垂直相交

然鹅,真相是,他们共同插在一个中置大背板上,而不是采用“正交连接器”直接相连,所以,该绕的路,一点都没有少。

华为CE12800在设计之初,就考虑了一步到位的正交Clos架构,这个架构一直沿用至今,保持了高度的延续性,一套板卡适用于所有规格的机箱。

用户即使在2012年产品发布之初就买入了交换机,用到2019年的今天,所有线卡任然保持通用,交换容量仍然可以平滑升级,与时俱进。

这个时候,我们才能更深的理解,设计一款具备真正“十年生命周期”的产品,是对自己的挑战,也对客户负责任……

今天,我们再去看整个数据中心交换机市场,会发现主流品牌,基本都“正交”了,但他们大部分都经过了几次“迭代”,出现过好几代机箱,从非正交→伪正交→真正交。这些机箱命名相似而不相同,线卡彼此不兼容,既造成用户选择困难,又不利于投资保护。

真正做到正交架构一步到位的,似乎只有华为。

因为,在当年,要做成一款正交架构的交换机,是对工程能力的巨大挑战:例如关键器件“正交连接器”的成熟度、正交架构对散热的考验、大尺寸单板的设计和加工能力、整机及结构精度控制等等。

说白了,正交架构体现出各厂家研发能力的积累,它就像一个“放大镜”,能充分展现优秀设计的精妙之处,也能把低劣的设计放大数倍揭露出来。

cacf8fe7e9a4abaaf5e847670fbd324d.png

迈过“正交架构”这道坎,似乎前面一片坦途。

然而,接下来的每个“细枝末节”,都暗藏玄机。

正交架构的后遗症之一是散热问题,交换机散热主要依靠“风冷”,从流体力学的角度看,正交架构不容易实现冷热风道隔离,对散热很不友好。

CE12800在早期架构设计的时候,架构师们仔细研究了国际标准组织对设备散热的定义、要求及未来展望,并参观了业界最先进的数据中心,做了多种设计模型不断的对比和优化,最后决定面向未来把CE12800设计成“严格前后风道”架构。

以前,我们常常把交换机“前后风道设计”当成一种控标参数来运用,实际上,无论从行业标准要求还是数据中心的对“能效比”的追求,“前后风道”都是刚需。

639d0ae74ae9ac24d6b0c1c5dabbccab.png

在高等级的数据中心机房,为了追求PUE指标,会采用机柜“面对面、背靠背”交错排列,形成隔离的冷热通道,这样可以形成较强的冷热对流循环,所以,设备采用前后风道设计,才能达到这种对流效果。

a6b308c14c2d0a8637146b5766dbde9a.png

作为一款“潜伏”在机房深处的设备,数据中心交换机有点“深藏功与名”,到底要不要重视颜值呢?

华为的工程师们陷入了激烈的思想斗争:以前产品强调的是功能、性能规格,外观上“抗造”就好,本质上就是一“铁疙瘩”,大家也都司空见惯。相对而言,企业网客户对产品的外观和质感会更加关注,“高颜值”的产品更容易赢得客户信任。

这个方针敲定以后,团队加大了工业设计投入,邀请知名的设计公司操刀,第一次从零开始讨论产品的眉头、走线齿、扳手、防尘门以及总体外观,关注每一个细节……

在设计板卡面板时,为增强产品质感,采用了更高成本的不锈钢。 但测试时发现,面板在人触摸后会留下指纹,可能影响观感,虽然这不影响使用,毕竟用户也不会天天跑到机房摸面板玩eb5250e57c5ba8d9ba46ad59344d0940.png

但是负责工业设计小伙儿不甘心,验证了多个方案,最终确保设备面板在人手触摸、插拔应用后,依然油光锃亮,“可以当镜子用”。

正是因为这种精益求精的精神,CE12800一发布,就引起了轰动,很多用户不光被强悍的性能和规格震撼,也被高颜值圈了粉。

44268e34f3f32427e39d35d33ba6f523.png

硬件的坎,就这样,一道道被华为人趟完了,但这只是一半。

硬件,只决定交换机的下限,它让交换机有了一副好皮囊,一副10年不落伍的好皮囊;软件,才定义了交换机的上限,它赋予了交换机灵魂。

于是,接下来,华为人又趟过一道道软件坎,实现了多个业内第一:

业界首个实现集群的业务通道和控制通道物理分离,可靠性更高;

业界首个将“1虚多”虚拟比实现到16的数据中心交换机;

业界首个在同一平台实现CSS集群和M-LAG技术的完美组合;

拥有归一化软件平台,使得一套板卡可以支持所有软件特性;

……

2012年6月,在迈过无数道坎之后,凝聚着华为VRP平台、硬件和整机工程20余年深厚积累的数据中心交换机旗舰——CloudEngine12800,终于震撼发布。

d2d6d8fb60ee869a9bf662752ee12799.png

.

.

.

.

时至2019年

a737678e82d2d521daf0807a1f2794cc.png

我想,当年CE12800交换机的研发项目组,在殚精竭虑、埋头攻关的时候,一定许过愿、吹过牛,憧憬过自己这款亲手打磨的产品,未来能到什么样的高度。

七年后,那些许过的愿、吹过NB,都成了真……,我们来看看成绩单吧。

4ece759d64ac6c1857e8a165615b37b3.png

 CE12800创造了一个神话:七年前奠定的体系架构,其间未再做任何硬件迭代,延用至今,仍然是业界最具竞争力的交换机旗舰。这块“金字招牌”,还可以挂上几年。

然而,华为人不满足,七年之痒,华为人“痒了”,他们的目光,瞄准了下个10年。

6935d2fca66415880099c1eb161421ad.png

随着人工智能和机器学习等应用的涌现,存储(存储介质从HDD到SDD/NVMe)和计算(CPU到GPU甚至AI芯片)性能都得到了百倍提升,数据中心网络也需要更大带宽和效率支撑AI业务。

400GE光接口已经开始踏上数据中心交换机的舞台,随之而来的,则是在功耗密度、高速互联、硬件可靠性等方面的技术挑战。

 你的网络准备好了吗?

曾经,CE12800重新定义了云时代的交换机,而现在,华为数据中心交换机已经完成新的关键技术突破和准备。

所有过往,皆为序章,这一次,华为要定义AI时代的交换机

华为网络春季新品发布会

be0b167937df2743f06cb3f3280b29ff.png

 首次亮相 

丨北京丨

2019年1月9日

请关注

424cae42d40e67e5e49f0d30a94f101b.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值