近期字节跳动上一则关于招聘芯片人才的新闻,再次引发了外界对于互联网大厂“造芯”的猜测。事实上,在“缺芯”潮持续发酵之下,“跨界造芯”早已经成为了近年来科技界的一个常用热词。无论是车企、手机厂商还是互联网大厂,都先后接二连三地扎进了“造芯”赛道,甚至于连地产、零售百货、家电等领域的企业也都纷纷参与其中,不由得给人一种“不造芯就落伍”的错觉。
不可否认,当下来看“造芯”似乎是挡不住的一场大潮流。不过,参与者虽众但真正了解自身“造芯”需求的企业其实并不多。那么,那些真正有志于“造芯”的企业,其真实动机究竟何在呢?
配图来自Canva可画
巨头“造芯”动机何在
在一众“造芯”的企业中,要论起真正需求明确的还要算是科技互联网公司了。
实际上,包括苹果、华为、OPPO等手机品牌在内的技术公司,在很早之前就已经率先在AI芯片领域“卷”了起来。2017年,苹果A11 Bonic 问世,首次采用自研GPU,首次搭载神经网络引擎,从此开启了智能手机AI时代;随后,华为“昇腾”系列芯片的出炉,则标志着华为正式进军AI处理器行业;而后OPPO也宣布进军半导体,打造自研芯片。
除了手机厂商之外,互联网公司如谷歌、亚马逊、BAT等,也都闻风而动。国外如谷歌,2014年就开始为数据中心设计服务器芯片了,2019年更是在印度组建了芯片团队;亚马逊AWS也在2018年底,披露了首款自研云服务器CPU Graviton。
国内如百度,2010年就开始采用FPGA自研AI芯片,2021年百度昆仑芯2更是实现了发布即量产;阿里也成立了“平头哥半导体有限公司”入局AI芯片,并在随后的2019年推出首款AI芯片含光800,腾讯也从前期的入股燧源科技,到亲自入局造AI芯片。再到最近的字节跳动,也被曝将自研云端AI芯片和ARM服务器芯片……不难发现,近乎大半个互联网圈有头有脸的公司,都已经参与了这场“造芯”盛宴。
而在一片“热闹”的背后,“造芯”的难度是显而易见的。那么,各路大厂为何还要来做这样一个长周期、慢回报、资金密集的高投入行业呢?答案是战略需要。
从内部来说,随着行业竞争加剧,企业迫切需要推出更加原创的硬件芯片,来支持自身的产品和服务战略落地。就研发芯片的动机来讲,无论是选择自研的华为、苹果,还是广有布局的BAT,其推动自研的核心动机,都与提升其产品体验和服务差异化这一核心需求分不开。
从外部而言,高通、AMD以及英特尔等芯片大厂提供的产品,越来越难以满足互联网科技厂商们的现实需求了。与其他领域一样,AMD、英特尔、高通等芯片厂对芯片的垄断,直接导致了很多科技公司采购芯片的成本在不断上升(比如持续涨价),过去由于话语权的羸弱使其只能听之任之;但如今随着各家自研芯片的出炉,其对大厂的“蛮横”也有了一些底气;另外,各家大厂的云服务所构建的生态并不完全相同,其对服务器芯片的需求自然也会有所差异,但通用型的芯片并不足以满足这一需求,这种情况下自研就成了其必选的一个选项了。
更深层的内在动因
如前文所述,无论是从战略层面还是现实层面来看,“造芯”对于技术驱动的大厂而言都值得尝试。但如果只是满足这些因素,这个选项至多也只能被大厂归入“应该做”的行列,尚不至于让大厂产生“亲自下场”的冲动,而能让大厂敢于参与其中的因素,必然与其内部条件允许脱不开关系。
首先,相比通用芯片的高门槛而言,专用芯片设计的研发对大厂而言相对容易许多。通常来说,芯片可以分为两大类:一类是通用性芯片,通常是我们听到的CPU、GPU和DSP等;第二类是专用芯片,包括FPGA、ASIC等等。而“通用”与“专用”的区别,通常在于其是否为执行某一特定运算而设计,如果用银行来做比喻的话,通用芯片相当于柜员,它需要处理复杂场景应对各种复杂状况,优点在于灵活、通用;而专用芯片则相当于“ATM机”,优点在于简单、高效。
目前大厂们所研究的芯片类型大多属于后者,高效是其核心诉求。比如,腾讯推出的三款自研芯片紫霄、沧海、玄灵,都在相应领域有突出表现,其中主打AI的紫霄相比业界的同等水平提升了100%,主打视频处理的沧海压缩率相比业界提升了30%以上,主打高性能网络的玄灵性能,相比业界提升了4倍。无独有偶,阿里平头哥研发的服务器芯片倚天710、含光800等均有远超业界预期的表现,百度的昆仑芯片2号不仅强于业界,而且较上一代性能提升了2-3倍。凡此种种,都能说明互联网公司的核心诉求正在于提升效率这一点。
当下,人工智能运算常常具有大运算量、高并发度、仿存频繁等特点,这使得传统的CPU、GPU等芯片已经难以满足当下市场的现实需要了,企业迫切需要更高性能的通用型智能芯片,在硬件层面给予人工智能算法以支持。但通用型智能芯片及其基础系统软件的研发,需要全面掌握核心芯片与系统软件的大量关键技术,技术难度高、涉及方向广,是一个极端复杂的系统工程,对于新入局的一众巨头而言仍有一定难度,相比之下自研专用的人工智能芯片则容易许多。
其次,大厂自身技术应用场景比较多,并且云基础设施雄厚、用户群体广众,其超大体量的规模足以帮助其将巨额的芯片研发成本摊薄,大大减小其推进风险。
对于“造芯”这样重研发重投入的行业来说,除了有钱之外还必须有量,甚至有“量”是比有钱更重要的事情。比如,苹果敢于入局SOC芯片,核心在于其每年稳定出货几千万的苹果手机,也唯有如此巨量的应用才能帮助其分摊由于芯片研发而投入的巨大成本。同样的道路,近期字节跳动入局“造芯”,理由也是其在国内外拥有海量的云基础设施(数据中心、服务器等资源),以及多达20亿月活用户的支持,这些因素都使其“造芯”的成本压力大大下降了。
另外,自主研发可以使其在成本与流程上做到最优,提高安全性和灵活性,在长中短各个阶段不同层次上进行更快的创新,使其在芯片的立项、进度和交付上掌握主动性。
从云中来到云中去
总的来看,巨头参与“造芯”有动机也有可行性,基本可算是万事皆备,但回到具体的落地实践上来说,方法同样很重要。目前来看巨头造芯所坚持的动作,无外乎是“从云中来到云中去”。
一方面,云巨头们以其在推动云服务发展中形成的清晰需求,指导其芯片制造的设计与发展。实际上,做芯片除了要考虑技术和工艺,最大的难点在于对芯片的“定义”。过去传统芯片的优势在于前者,但弊端是通常需要芯片做出来再去匹配需求,这会使其在很多场景下损失其真实性能。而包括谷歌、百度、腾讯等大的互联网企业,它们本身就是需求方,它们对自身的需求最清晰、也最明确,因此“造芯”出来的结果,跟其业务本身会形成比较好的一个协同和适配。
比如,百度2019年推出的由三星代工的昆仑一代芯片,就主要应用于百度熟悉的业务如搜索排名、语音识别、图像处理以及自然语言处理等应用领域;2021年8月,百度推出的二代昆仑芯片,则将其主要应用于互联网、智慧城市、智慧工业等领域,同时还可以赋能高性能计算集群、生物计算、智能交通以及无人驾驶等行业,应用领域显然比之前更广一些,但领域依旧是百度正在推进的AI应用场景。
同样的道理,阿里平头哥的芯片很大程度也直接服务于阿里云的生态建设。比如,阿里先后推出了ARM服务器芯片“倚天”,AI芯片“含光”,RISC-V架构CPU核“玄铁”,射频识别芯片“羽阵”,基本布局覆盖云端到终端全流程。另外,其还基于神龙架构,推出了自己的云服务器神龙服务器,并设计了自己的智能网卡芯片X-Dragon。总之,通过不断丰富生态增强其软硬一体的协作能力,阿里云在云服务市场的地位得到不断巩固和增强,其“一云多芯”战略也得到了切实落实。
另一方面,巨头“造芯”的目标,仍然服务于巨头的云战略规划。从云服务行业的现实情况来看,客户对于云上性价比的追求是永无止境的,未来云上工作负载对于计算创新的要求也是无止境的,这就决定了追求更高效能的全新技术,将会是芯片研发服务于云战略的战略核心。
比如,巨头通过自主设计芯片以及服务器等硬件,使其在云服务基础设施市场具有更强的定价能力和差异化,从而可以帮助其挽回在IAAS市场因为同质化竞争,而导致的低毛利困境。站在当下来看,自研芯片虽然不是云厂商开展业务的必需,但却决定了云厂商的天花板,并象征着云巨头的身份。
难以避免的持久战
从入局的目的来看,现阶段互联网大厂造芯的“出口”,最终大多精准地瞄向了自身的业务。而从“造芯”这件事本身来看,“造芯”的高门槛决定了入局“造芯”的大厂,很难避免后续过程的持久战。
首先,AI芯片相比传统芯片的复杂度变高了,后续的投入周期也随之变长,这意味造芯公司想要在短期之内取得进展是不切实际的。
据业内人士分析,随着集成电路进入后摩尔时代,互联网巨头们在芯片设计中面临的挑战逐渐增多。一则随着AI芯片性能需求加重,需要不断投入至先进工艺中,其带来的技术好处也不像之前那样的线性与直接;二则,随着功能的增加和对效能要求的提升,其在流片费用、设计复杂度以及开发周期等方面也面临越来越严峻的挑战。
对于参与其中的企业而言,其不仅要在系统应用方面加强顶层设计,增强算法到设计,以及算法、软件、架构、软硬件协同等各方面的优化和战略协同,而且还必须要从数字设计到物理实现,以及工艺封装等各个层面进行综合思考,统筹各种因素以求取最优解。而要达成这样的过程,必然需要花费很多的时间和资金投入,短期之内很难见效。
其次,从整个芯片行业本身的发展规律来说,其重资产、重研发的特性,决定了任何参与者都不可能在短期内取得巨大成功。
过去苹果连续押注芯片设计十几年,才逐渐取得了A系列芯片的突破,对于刚刚进场的互联网巨头而言这个过程自然也是必不可少的。目前为止,各路互联网巨头仍处在量变到质变的前期阶段,远没进入到一个大规模爆发、质变型产品大规模量产的阶段,因此其接下来还有很长的路要走。
另外,芯片对巨头战略上的极端重要性,决定了大厂在这个领域绝不会轻易放弃,这就意味着巨头未来在芯片领域的投入将会是长期的。