高通公司高级副总裁Anand Chandrasekher手持一块Centriq 2400芯片样品。
高通公司表示其已经开始向客户提供Centriq 2400样品,即由该公司打造的10纳米制程64位ARMv8-A通用型服务器级系统芯片。
这家总部位于加利福尼亚州圣迭戈的移动芯片设计厂商已经从AMD、英特尔、博通以及自身内部技术人才池中招募到大量工程师,共同致力于开发这一处理器家族。高通公司认为通过直接杀向10纳米制程水平,其将在与英特尔的竞争中保持领先——后者目前仍在销售14纳米服务器CPU。
在英特尔的x86世界当中,处理器利用特殊制程节点所制造,优先面向台式机与笔记本设备,而其服务器CPU家族则会于次年完成同一波升级换代。举例来说,英特尔的10纳米PC芯片代号为Cannonlake,其计划于2017年下半年推出。而10纳米级别至强服务器芯片则会延后约12个月,即于2018年下半年投放市场。
高通公司指出,其目前的目标是在2017年下半年批量出售10纳米FinFET服务器CPU,相对于英特尔早了一年。尽管英特尔方面在芯片制造技术方面占据领先优势,但高通则统治着移动芯片领域——其10纳米FinFET骁龙835系统芯片专门面向智能手机平台,由三星公司负责制造并将于明年夏季之前推出。高通公司目前正积极将其在10纳米移动半导体领域的专业知识引入数据中心之内。
高通公司并未将Centriq像其它ARM兼容型数据中心芯片那样设计为专门面向利基性工作负载; 相反,该芯片设计厂商认为Centriq完全能够与英特尔至强数据中心方案进行正面对抗。Centriq 2400将拥有高达48个计算核心并配备单插槽。高通公司的工程师们表示单插槽设计可能会令人有些意外,毕竟大多数人都会将双插槽视为必然——即在单一系统芯片封装内容纳24个计算核心,双插槽共同实现48核心。英特尔公司的至强E5-2600 v4每插槽最高计算核心数量为22个,而至强E7 v4则最高为24个。
另外需要强调的一点是,其并不属于原有骁龙系统芯片面向数据中心任务作出的直接容量扩展型方案。事实上,其采用高通公司原创设计的Falkor微架构,与ARMv8-A相兼容且专门为Centriq产品线所开发。尽管其仍然共享移动端表亲的部分设计元素——例如通过模拟电子元件进行温度感应——但其使用方向则完全不同。作为一款服务器组件,其高度关注每瓦特性能这一核心指标,且最大程度确保性能水平不会因此受到影响。其拥有高容量缓存,提供RAM控制器以匹配计算节点中常见的内存类型等等。其晶片预计会根据测试性能水平采取不同的封装方式,而这种要求完全符合性能规格、要么根本无法正常运行的封装思路与移动系统芯片完全不同。
主要细节
来自高通公司提供的Centriq 2400演示文稿。
Centriq于今年早些时候被高通公司正式定为其64位服务器处理器的代号。今年10月,高通方面展示了其24核心14纳米FinFET原型设计芯片,而其随后演变为如今的10纳米2400。当时,高通方面已经开始向各顶级云服务供应商提供能够与该原型设计芯片相匹配的开发工具包用以调查研究。目前,高通公司再次向各云服务供应商提供芯片样品,而其最终将转化为商用化Centriq系统芯片。
根据高通公司工程师们的介绍,该系列芯片符合ARM标准——包括春服务器基础系统架构以及服务器基础引导要求,意味着该硬件可在无需其它调整或者特殊驱动程序的配合下为用户所理解及支持。希望这能够将ARM开发社区引入至该平台之上,从而为其带来更多相关应用程序、中间件、操作系统以及技术支持。这款芯片还将包含ARM TrustZone以执行某些高安全性任务。
“与其它服务器处理器,特别是英特尔方面的产品一样,高通Centriq 2400的配套驱动程序也将被引入Linux系统当中。这些上游提供的驱动程序随后会被引入各类Linux发行版,”该技术团队的一位发言人告诉我们。
高通公司的计划是将这些处理器——其中包含CPU计算核心、内存与IO控制器以及多种外围设备控制器——出售给云服务巨头(例如谷歌及Amazon等)以及价格相对低廉的白盒服务器制造商(例如纬颖科技、广达电脑与富士康等),由其构建开放计算兼容性设备以实现开源软件的购买、安装及运行。目前世界前八大云服务巨头——包括谷歌、Amazon、微软、百度以及腾讯等——都在对Centriq芯片进行测试。
目前该产品仍处于开发阶段:高通公司坦言,其确切规格、封装以及速度与交付进度距离真正的系统组装制造还有六个月距离。
实拍图
高通公司位于加利福尼亚州圣何塞的办公室内拍下的芯片真容。
为什么用户应当考虑将其计算工作负载由x86转移至ARMv8?关于这个价值影响达数十亿美元的问题,高通公司数据中心技术负责人Anand Chandrasekher表示,各服务器制造商将对Centriq方案抱有兴趣,我们猜测这可能是因为该系统芯片将与FPGA及GPU等加速机制紧密结合。当然,大家也可以将这些附加引擎纳入现有x86 CPU当中,而各大面向机器学习及其它大规模处理业务的企业也确实采取了这样的作法。
Chandrasekher指出,考虑ARM还有着其它理由:将其作为备用资源。谷歌及其它厂商正在数据中心内尝试使用IBM Power及ARM计算核心,旨在评估利用其替代英特尔处理器的可能性——谷歌公司高度倾向于在其数据中心内引入混合型架构,这显然有助于推动高通方面将其ARM服务器芯片家族推向市场的野心。
从本质角度讲,英特尔公司的CPU占据全球数据中心计算处理器市场99%份额,而任何出现在这一领域中的竞争都将有助于创新、价格调节以及供应安全。
我们希望各顶级云服务供应商能够考虑将基于ARM架构的Centriq作为通用型处理方案。如果其能够在架构层面实现成功扩展,那么未来还将被广泛部署至更多大规模企业当中,这将逐步削弱英特尔公司的垄断地位。
“有选择显然是件好事,而Centriq带来的创新成果也能够带来更为丰厚的收益,”Chandrasekher本周一表示。“我们首先与大规模数据中心运营商进行合作,他们将在未来拉拢到更多企业用户。”
时间
高通公司这一次很可能是找对了时间与切入点。在此之前,关于ARM服务器级芯片市场出现了大量炒作性宣传,但这些泡沫最终一一破灭。Calxeda公司承诺引领计算新纪元,但最终却未能及时提供64位CPU产品。Applied Micro的X-Gene产品家族已经被整体售出,博通的Vulcan项目事实上也已经失败,更遑论已经决定将未来命运押在x86 Zen架构身上、而非ARM服务器芯片的AMD公司。高通方面则一直相当低调,最终却一举拿出了人们长久以来所期待的解决方案。
Centriq芯片拥有三大特性,而这些是过去五年来一直阻碍着ARM数据中心实现的痛点所在。首先其采用64位ARMv8-A架构,优于当初炒作刚刚兴起时所能实现的32位。其采用10纳米制程工艺,这也是实现一款在性能与功率上具备可行性的服务器级ARM处理器的前提条件。
另外,其还站在了云巨人的肩膀之上,这些供应商正在越来越多地将企业客户投向传统内部设施供应商的IT预算收入自己囊中。在云环境下启动节点并运行软件即服务时,大家可能根本不在乎其采用的到底是x86还是ARM架构,只要其能够执行并提供您所需要的API及系统环境即可。再有,运行ARM服务器在成本上低于英特尔设备,且不会造成性能损失,这一点对于那些每季度需要购置数十万块处理器的云巨头而言非常重要。这已经成为一种现实的经济问题,而非CPU架构问题。
为何始终遮遮掩掩?
ARM服务器芯片总是罩有一层神秘的面纱,因此很多人认为其已经在一定程度上宣告失败。除了Vulcan项目这类实际上已经消失的成果之外,根据我们与从业者的对话来看,这种遮掩态度源自三方面理由。
其一在于,此类芯片只面向一流云服务供应商——包括谷歌、Amazon、微软与百度等——因为这些巨头一直在寻求新型芯片进行评估,并可能将其纳入设备以支持各类定制化应用。这类举措往往非常隐秘,旨在防止竞争对手掌握其网络及应用层面的最新动向,并最终导致其丧失竞争优势。正因为如此,我们才很少从谷歌等厂商处听闻其采用非英特尔芯片。
另一个原因在于,中国对于非英特尔芯片抱有浓厚兴趣,特别是那些可自主授权及开发的处理器设计组件。因此,西方世界一直对此避而不谈。
最后也是最重要的理由源自英特尔。芯片巨头不惜采取一切措施以应对在PC及数据中心领域挑战其霸主地位的行为。考虑到其已经基本上垄断了全球服务器环境,这样的作法也并不令人意外。
这样的压力导致众多原本考虑使用非x86设备的企业不得不另谋出路,即继续购买更多至强处理器。除非时机成熟,否则没有哪家厂商愿意向英特尔公布自己的ARM服务器芯片规格及定价,否则必然招致对方的全力打压。
高通公司自然也不例外,Centriq处理器的公布自然会引发英特尔方面强烈的愤怒情绪。
原文发布时间为: 2016年12月8日
本文作者:毕波
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。