ITValue
大模型时代的存储主控芯片,如何兼顾性能、能耗和成本。
作者|张帅
编辑|盖虹达
首发|钛媒体APP
太多人关注大模型的算力,以至于忽略AI生态系统中的其他环节,存储是其中的代表。
计算、存储、网络是数字基础设施的三大件,三者紧密联系又互相依赖,计算需要数据,数据传输依赖网络,原始数据、过程数据、结果数据都需要存储,在大模型的训练和推理过程中,任何一个环节的低效都会演变为整个系统的低效。
慧荣科技股份有限公司((Silicon Motion Technology Corp.,NasdaqGS:SIMO,以下简称慧荣科技)1995年成立于美国加州硅谷,2005年在纳斯达克上市。慧荣科技拥有20年以上的设计开发经验,为SSD及其他固态存储装置提供存储解决方案,应用范围包括智能手机、PC数据中心、商业及工控应用等,是全球最大的NAND Flash主控芯片供应商,其中SSD主控芯片的出货量全球第一。
2023年底,慧荣科技公布了新的组织架构,成立终端与车用存储(Client & Automotive Storage; CAS)和企业级存储与显示接口解决方案(Enterprise Storage & Display Interface Solution; ESDI)两大业务群,前者负责消费级SSD主控芯片、移动存储主控芯片、Ferri 产品和扩展式存储主控芯片,后者负责企业级SSD主控芯片和显示接口产品。
关于大模型对存储的影响,企业级和消费级存储的现状,Arm和RISC-V的趋势等话题,钛媒体近日对话了慧荣科技终端与车用存储业务群资深副总段喜亭。
01
企业级存储持续上扬,
预计第四季度传导至消费级市场
相较于以GPU为代表的大模型算力,和支持千卡、万卡互联的大模型网络,存储在普通用户层面受到的关注不多,但在产业和市场层面,存储的供需和价格说明了内在联系。
“内存原厂颗粒价格不断升高,消费级终端需求不佳,上半年零售市场对存储的需求不高,但企业级存储市场的增长非常强劲,多少都与大模型带来的需求相关,全球主要CSP仍在建设大规模数据中心,这也是厂商不愿降低闪存颗粒的价格的主要原因之一。”慧荣科技终端与车用存储业务群资深副总段喜亭表示。
“大模型对于存储的带动正在从企业级蔓延至消费级,只有在数据中心层面的计算、网络和存储都准备好,大模型的风口才会吹响终端,目前已经显露出一些苗头。”段喜亭表示。
他预估,下半年内存合约价格维持上涨的态势不变,但是涨价幅度会逐渐收敛,企业级存储的需求能否持续也是一个很大的影响因素。
在消费级领域,下半年AIPC和AI手机逐步开始推向市场,但是对于存储的带动可能要到第四季度才有所显现。四季度最新一代苹果手机的发布,将是首款接入大模型的苹果手机,行业都在关注苹果的示范效应,是否能带来足够大的推力,将很大程度影响存储的供需关系。
不同于数据中心,大模型进入终端至少还有三重难关,成本、能耗和微型化,三种呈现出互相关联的关系。
企业级数据中心大量采购英伟达GPU以及高频宽內存(HBM)等产品,价格始终居高不下,对于消费者而言,手机和PC产品的价格是影响购买决策的关键因素,大模型手机可能导致价格大幅升高,必然会影响到普及。
专用芯片和HBM等带来更强的功能,也会带来更高的能耗,目前手机电池容量提升的空间较小,因此需要将大模型经过一系列优化,以适应终端场景,大模型参数的微型化是主要方向之一。
10亿参数的大模型占用手机内存空间约为1GB,在很多场景,终端所搭载的大模型参数已经降至数亿以内,终端大模型不追求“大”,更多是性能、成本、功耗的平衡,找到大模型在终端层面的“杀手级应用”。
汽车存储所受到的限制相对小,因为电池容量更大,对于降低能耗的要求尚不迫切,因此存储无需太多改变。但段喜亭预计,汽车厂商与主机厂的价格战可能会影响供应商的利润空间,甚至有可能出现劣币驱逐良币的效应,使得存储厂商没有动力投入研发,导致行业进入到一个不健康的周期。
图片系AI生成
02
存储主控芯片如何演进
不止于大模型终端,存储主控芯片也面临着类似的问题,即如何兼顾性能、能耗和成本。
结合行业现状来看,SSD主控芯片的门槛正变得越来越高,例如PCIe Gen4升级至5,吞吐量翻了一番,UFS(高端手机常用存储)3.1到4.0,带宽也翻了一倍,如果芯片厂商不从架构设计等方面做优化,能耗将成为严重问题。
慧荣的存储主控芯片由台积电代工,可以采用最新的先进制程,此外结合慧荣自己的设计,实现了在功耗增长不大的情况下,性能大幅提高。“在单位瓦数传递数据的速度越高,证明芯片的效能越好,这是AI时代存储主控芯片一个很重要的衡量指标,我们可以做到比前代产品提高约30%以上的效能水平。”段喜亭说。
在芯片架构方面,存储主控芯片此前多采用Arm架构,但随着RISC-V架构的兴起,行业内也出现了多款基于RISC-V架构的芯片。
对此,段喜亭认为,大模型成为行业发展的一个分水岭。在大模型时代之前,RISC-V来势汹汹,它没有太多历史包袱,成本相对较低且容易获得,更重要的是不在美国制裁的范围内,Arm架构好处是成熟稳定,有完善的生态系统,但是成本相对较高,因此RISC-V对Arm产生了一定程度的冲击。
大模型时代,Arm架构迅速将AI特性融入到产品中,Arm的客户群体也由此扩大,而RISC-V的开源路线会造成一个缺点,在产业变革的时候反应会变慢。目前RISC-V的市场声量不高,RISC-V的发展趋势有所放缓,行业也在思考在RISC-V芯片中加入AI功能的想象空间。
谈及国内存储厂商发展,段喜亭表示,前几年国内存储厂商如雨后春笋般涌现,如今收敛到有限的几家企业,发展好的已经上市,其中的关键是找准自己的定位。
“对国内的初创公司,我们都希望他们成功,能够站稳脚跟的创业存储厂商,一开始就对自己有清楚的定位,不是盲目投资做高大上,但是不重视收益回报,我们欢迎这样的厂商,一起把市场做大,大家都有自己在行业内的角色,而不是把市场弄得很卷。”(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)
*温馨提示:喜欢ITValue公众号的小伙伴注意啦!根据公众号推送新规,请将ITValue设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”哦
我知道你在看哦