阿里云张献涛:自主最强DPU神龙的秘诀

如果细数最近火爆的科技概念,DPU必然位列其中。

这是英伟达一手捧红的新造富故事,是2021年SoC领域最热火朝天的创业赛道,也是数据中心继CPU、GPU后的又一大“台柱子”。

尽管在云计算领域已经培育多年,但对于外界来说,DPU并不是一个容易理解的概念,各路玩家的产品定义和结构设计也不尽相同。

总体来说,DPU是个软硬一体的数据处理单元,通常以架构的形式存在,可以帮CPU“减负”,解决一些CPU处理数据方面的短板问题,并提供硬件加速的网络、存储、安全、基础设施管理等服务。

而追溯DPU的源头,真正实现大规模商用DPU架构的,历数全球,主要有两家云计算巨头——西方的亚马逊云AWS,东方的阿里云。

2017年10月,阿里云的神龙架构横空出世;仅1个月后,AWS的Nitro也走到了历史台前。这两个为了解决虚拟化问题而相继问世的创新产品,被业界视作迄今最成功的两款DPU。

一手促成神龙架构诞生的张献涛,也是国内最懂DPU的人物之一。

如今,第四代阿里云神龙已经开始支撑阿里云的大规模云上业务,并在计算、存储、网络、安全四项关键指标达成业界最高水平。

近日,芯东西独家对话阿里巴巴集团研究员、阿里云弹性计算产品线负责人张献涛(花名旭卿),听他讲述云端业务需求变化、持续创新的研发心得,以及对DPU热潮的独到思考。

在他看来,这不是一类适合走通用路线的芯片,对于云厂商而言,DPU是一个软硬件技术栈结合极其密切的工作,是软件定义的计算架构,DPU必须以自研为主,做到相关软硬件技术栈完全可控,且经过超大规模验证。而做通用DPU的公司很难满足云厂商的需求,被收购或许是最佳结局。

01 风起云计算

DPU的新风口来得突然。

2020年10月,在NVIDIA GTC 2020大会上,NVIDIA创始人兼CEO黄仁勋宣布推出一种全新数据处理器——DPU。这颗被称作“未来计算三大支柱之一”的处理单元,赫然闯入大众和资本的视野。

此时,距离阿里云软硬一体虚拟化架构「神龙」的诞生,已经过去整整四年。如今,其被市场视作阿里云的DPU,而这个颇具开创性的创新架构,当初是为解决传统虚拟化技术应用到云计算带来的成本、性能、服务质量以及安全问题而生的。

张献涛是负责阿里云神龙的核心人物,于2014年加入阿里云,彼时他已经从事虚拟化技术研究约十年,阿里云刚走到第五个年头。传统虚拟化架构的种种缺陷,日渐成为掣肘这家云计算公司降本增效、提升服务质量的顽疾。

虚拟化技术是云计算的基础,它将原本不可分割的硬件资源抽象成共享资源池,按需分配和共享计算、存储、网络资源。

而管理资源,就需占用掉一些原本用于运行业务负载的CPU和内存,也就造成了资源损耗。比如一个工厂有100位工人,如果他们全部去流水线上干活,那

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值