对话慧荣科技段喜亭:别只关注大模型算力,存储变革正从企业级传导至消费级...

ITValue

ba3edc45f5020a539629cc971811ea72.jpeg

大模型时代的存储主控芯片,如何兼顾性能、能耗和成本。

作者|张帅

编辑|盖虹达

首发|钛媒体APP

太多人关注大模型的算力,以至于忽略AI生态系统中的其他环节,存储是其中的代表。

计算、存储、网络是数字基础设施的三大件,三者紧密联系又互相依赖,计算需要数据,数据传输依赖网络,原始数据、过程数据、结果数据都需要存储,在大模型的训练和推理过程中,任何一个环节的低效都会演变为整个系统的低效。

慧荣科技股份有限公司((Silicon Motion Technology Corp.,NasdaqGS:SIMO,以下简称慧荣科技)1995年成立于美国加州硅谷,2005年在纳斯达克上市。慧荣科技拥有20年以上的设计开发经验,为SSD及其他固态存储装置提供存储解决方案,应用范围包括智能手机、PC数据中心、商业及工控应用等,是全球最大的NAND Flash主控芯片供应商,其中SSD主控芯片的出货量全球第一。

2023年底,慧荣科技公布了新的组织架构,成立终端与车用存储(Client & Automotive Storage; CAS)和企业级存储与显示接口解决方案(Enterprise Storage & Display Interface Solution; ESDI)两大业务群,前者负责消费级SSD主控芯片、移动存储主控芯片、Ferri 产品和扩展式存储主控芯片,后者负责企业级SSD主控芯片和显示接口产品。

关于大模型对存储的影响,企业级和消费级存储的现状,Arm和RISC-V的趋势等话题,钛媒体近日对话了慧荣科技终端与车用存储业务群资深副总段喜亭。

01

企业级存储持续上扬,

预计第四季度传导至消费级市场

相较于以GPU为代表的大模型算力,和支持千卡、万卡互联的大模型网络,存储在普通用户层面受到的关注不多,但在产业和市场层面,存储的供需和价格说明了内在联系。

“内存原厂颗粒价格不断升高,消费级终端需求不佳,上半年零售市场对存储的需求不高,但企业级存储市场的增长非常强劲,多少都与大模型带来的需求相关,全球主要CSP仍在建设大规模数据中心,这也是厂商不愿降低闪存颗粒的价格的主要原因之一。”慧荣科技终端与车用存储业务群资深副总段喜亭表示。

“大模型对于存储的带动正在从企业级蔓延至消费级,只有在数据中心层面的计算、网络和存储都准备好,大模型的风口才会吹响终端,目前已经显露出一些苗头。”段喜亭表示。

他预估,下半年内存合约价格维持上涨的态势不变,但是涨价幅度会逐渐收敛,企业级存储的需求能否持续也是一个很大的影响因素。

在消费级领域,下半年AIPC和AI手机逐步开始推向市场,但是对于存储的带动可能要到第四季度才有所显现。四季度最新一代苹果手机的发布,将是首款接入大模型的苹果手机,行业都在关注苹果的示范效应,是否能带来足够大的推力,将很大程度影响存储的供需关系。

不同于数据中心,大模型进入终端至少还有三重难关,成本、能耗和微型化,三种呈现出互相关联的关系。

企业级数据中心大量采购英伟达GPU以及高频宽內存(HBM)等产品,价格始终居高不下,对于消费者而言,手机和PC产品的价格是影响购买决策的关键因素,大模型手机可能导致价格大幅升高,必然会影响到普及。

专用芯片和HBM等带来更强的功能,也会带来更高的能耗,目前手机电池容量提升的空间较小,因此需要将大模型经过一系列优化,以适应终端场景,大模型参数的微型化是主要方向之一。

10亿参数的大模型占用手机内存空间约为1GB,在很多场景,终端所搭载的大模型参数已经降至数亿以内,终端大模型不追求“大”,更多是性能、成本、功耗的平衡,找到大模型在终端层面的“杀手级应用”。

汽车存储所受到的限制相对小,因为电池容量更大,对于降低能耗的要求尚不迫切,因此存储无需太多改变。但段喜亭预计,汽车厂商与主机厂的价格战可能会影响供应商的利润空间,甚至有可能出现劣币驱逐良币的效应,使得存储厂商没有动力投入研发,导致行业进入到一个不健康的周期。

bc2701a8a974e5ccf792eaa884e53a47.jpeg图片系AI生成

02

存储主控芯片如何演进

不止于大模型终端,存储主控芯片也面临着类似的问题,即如何兼顾性能、能耗和成本。

结合行业现状来看,SSD主控芯片的门槛正变得越来越高,例如PCIe Gen4升级至5,吞吐量翻了一番,UFS(高端手机常用存储)3.1到4.0,带宽也翻了一倍,如果芯片厂商不从架构设计等方面做优化,能耗将成为严重问题。

慧荣的存储主控芯片由台积电代工,可以采用最新的先进制程,此外结合慧荣自己的设计,实现了在功耗增长不大的情况下,性能大幅提高。“在单位瓦数传递数据的速度越高,证明芯片的效能越好,这是AI时代存储主控芯片一个很重要的衡量指标,我们可以做到比前代产品提高约30%以上的效能水平。”段喜亭说。

在芯片架构方面,存储主控芯片此前多采用Arm架构,但随着RISC-V架构的兴起,行业内也出现了多款基于RISC-V架构的芯片。

对此,段喜亭认为,大模型成为行业发展的一个分水岭。在大模型时代之前,RISC-V来势汹汹,它没有太多历史包袱,成本相对较低且容易获得,更重要的是不在美国制裁的范围内,Arm架构好处是成熟稳定,有完善的生态系统,但是成本相对较高,因此RISC-V对Arm产生了一定程度的冲击。

大模型时代,Arm架构迅速将AI特性融入到产品中,Arm的客户群体也由此扩大,而RISC-V的开源路线会造成一个缺点,在产业变革的时候反应会变慢。目前RISC-V的市场声量不高,RISC-V的发展趋势有所放缓,行业也在思考在RISC-V芯片中加入AI功能的想象空间。

谈及国内存储厂商发展,段喜亭表示,前几年国内存储厂商如雨后春笋般涌现,如今收敛到有限的几家企业,发展好的已经上市,其中的关键是找准自己的定位。

“对国内的初创公司,我们都希望他们成功,能够站稳脚跟的创业存储厂商,一开始就对自己有清楚的定位,不是盲目投资做高大上,但是不重视收益回报,我们欢迎这样的厂商,一起把市场做大,大家都有自己在行业内的角色,而不是把市场弄得很卷。”(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)


*温馨提示:喜欢ITValue公众号的小伙伴注意啦!根据公众号推送新规,请将ITValue设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”

我知道你在看哦

9b5df7ab731e389903dd3576c9bece75.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值