存储正式迈入超大容量SSD时代!

随着人工智能技术的飞速发展,存储在其中发挥着至关重要的作用。特别是在AI训练过程中,存储SSD(固态硬盘)的高性能和可靠性对于提升训练效率和保证数据安全具有不可替代的作用。

图片

存储SSD在AI发展中的作用和趋势,存储将在两个方面发挥至关重要的作用。一种是本地高速存储,用作缓存,用于将训练数据馈送到 GPU 上的 HBM。由于性能需求,使用了高性能 SSD。

图片

存储的另一个关键作用是将所有训练数据集保存在大型数据湖中。AI应用需要处理大量的数据,这些数据可能来自多个来源,包括图像、视频、文本、音频等。为了有效地管理这些数据,组织通常将其存储在大型的数据湖中。AI训练阶段涉及庞大的数据集和复杂的计算,要求存储系统具备高速读写能力和超大容量。而AI推理阶段虽然数据读取频率高于写入,但同样需要高效的数据访问速度来支持实时决策。这直接推动了对60TB至100TB甚至更大容量SSD的需求。

图片

随着AI应用的蓬勃发展,尤其是对AI推理服务器能效要求的日益提升,北美客户对存储产品的需求显著增加,带动了企业级QLC SSD出货量的快速增长。QLC SSD的快速读取速度和总体拥有成本(TCO)优势。相较于主要执行频繁数据写入的人工智能训练服务器,AI推理服务器侧重于读取操作,而QLC企业级SSD不仅能提供更快的读取速度,最大存储容量已扩展至64TB/128TB,远超主流企业级硬盘(通常为20至24TB),在读取密集型任务中展现出明显优势。此外,QLC SSD在能耗和空间占用上的节省,使其成为大型AI客户在追求能源效率时的理想选择。

随着单个cell含有的bit数越多,NAND的可靠性也会有所降低,自然成本也会继续下降,QLC的成本只有SLC成本的1/4。除了寿命可靠性,QLC处于劣势,还有在性能方面也有所降低,如下图,QLC NAND单个page页的写延迟是SLC的8倍,是TLC的2倍,读延迟是SLC的4倍,是TLC的约1.3倍。

图片

QLC SSD的目标不是取代TLC,而是与HDD抢市场:

  • 顺序读:TLC/QLC完胜HDD,同时QLC和TLC持平,达到同样的性能水平

  • 随机读性能:TLC/QLC更是优势巨大,QLC比TLC稍微弱一点

  • 随机读写延迟:HDD基本在ms级别,TLC/QLC都在us级别,相差一个数量级,优势明显。但是QLC在随机写性能方面比TLC要差很多,差距在10倍以上。

图片

QLC在读方面与TLC的差异不大,因此QLC SSD的目标使用场景也主要是读为主的业务场景。TLC/QLC分别在block size块大小和读写分布的适用性,如下图总结。找准了自己的定位,QLC SSD就可以发挥自己的优势,带着梁静茹给的勇气向前出发了!

图片

根据上面的信息来看,也就不难理解,为何北美客户开始针对AI推理场景,疯狂抢货QLC SSD大容量SSD了!

图片

随着容量的增加,在解决方案中还有一个因素需要考虑:IOPS/TB, 也就是单TB达到的IOPS性能。容量的增加,会让每TB获得的IOPS性能也相应的下降。QLC SSD如果要在容量增加的基础上,继续保持竞争力,IOPS也是非常关键的因素。对比不同协议接口SATA/SAS/PCIe可以清楚的发现,QLC SSD搭配PCIe协议接口才是当下最具竞争力的CP组合。

图片

目前业内3D-NAND工艺架构主要分为两个阵营,一个阵营,以Solidigm(Intel NAND卖给海力士后新成立的公司)为首,采用Floating Gate(FG)浮栅,另外一个阵营三星/WD等,采用Change Trap Flash。FG浮栅将电荷存储在导体中,而CTF将电荷存储于绝缘体中,这消除了单元之间的干扰,提高了读写性能,同时与浮栅技术相比减少了单元面积。不过,FG浮栅对read disturb和program disturb的抗干扰比CTF要好。

图片

FG浮栅架构在Program过程,采用4-16 program算法,这个过程可以减少program disturb写干扰。

图片

CTF架构,或者叫做RG架构,采用16-16 progam算法,两次program都要求所有page直接写入NAND,第一次program电压是放置在最终电压附近。CTF的Data Retention相对比较严重。

图片

在写性能方面的对比,不同的架构有不同的表现。

图片

  • 在TLC NAND中,CTF架构tPROG比FG浮栅低18%,所以在TLC SSD中,CTF架构TLC NAND SSD的性能比FG架构TLC NAND SSD性能要好

  • 在QLC NAND中,由于program算法差异的影响,FG浮栅表现更好,FG架构QLC NAND SSD性能比CTF架构QLC NAND SSD性能要好

固态硬盘(SSD)的最大容量预计将在2025年中期翻一番,达到122TB甚至128TB。近期在FMS 2024大会上,多家SSD厂商发布了超大容量120TB以上的QLC SSD,存储也正式迈入了超大容量SSD时代

Solidigm推出的D5-P5336 61.44TB企业级QLC SSD自从2023年中期上市以来,在过去的几个季度里经历了前所未有的需求增长,主要受人工智能数据中心对高容量存储的旺盛需求驱动。尽管多个供应商已经认识到并开始准备相应产品来满足这一需求,但Solidigm在市场上占据了领先地位。

在2024年的闪存峰会上,Solidigm展示了即将发布的122TB企业级QLC SSD的U.2版本。这些Gen 4驱动器在一台2U服务器中运行演示,预计将于2025年初正式发布。

图片

61.44TB的D5-P5336目前使用的是192层3D QLC,基于浮栅架构。与SK hynix提供的另一种架构——电荷陷阱相比,浮栅架构在QLC耐久性方面具有明显优势。SK hynix的238层NAND也有QLC版本,这意味着Solidigm可以在最终的122TB SSD中选择使用这两种NAND技术之一。Solidigm预计将在2024年底之前确认具体的技术选择,以便为2025年上半年的大规模发货做准备。

图片

浮栅架构的优势在于其能够提供更好的QLC耐久性,这对于需要长期稳定运行的高容量SSD尤为重要。Solidigm预计将在2025年初推出122TB的企业级QLC SSD,这将进一步巩固其在高容量存储市场的领导地位。

此外,根据小编了解到的信息, Solidigm 122TB QLC也是192层FG NAND,并采用32KB IU(间接寻址单元),此前QLC SSD主要为16KB IU。例如,若IU设置为16KB,则意味着每16KB的逻辑空间仅需要一个映射条目指向一个物理块。这样可以显著减少DRAM消耗,尤其是在大容量SSD上,避免因存储映射信息所需的DRAM资源过多而增加成本。

更多SSD IU原理分析参考如何突破SSD容量提升的瓶颈?

西部数据在确认开始向数据中心客户发送64TB SSD样品的一周后,在2024年闪存峰会(FMS)上展示了其下一代产品——128TB固态硬盘(SSD)。西部数据128TB SSD采用了公司的BiCS8 QLC NAND内存技术,具有218层堆叠和混合键合方案,被称为CMOS直接键合到阵列(CBA)。这是一种进化的技术,继承了Micron的CMOS-under-Array (CuA)和SK hynix的Periphery-under-Cell (4D PUC)技术。

图片

扩展阅读WDC西部数据闪存业务救赎之路,会成功吗?

再多提一句,WDC西部数据与Koxia拥有共用的NAND工厂,这两家的NAND技术可以认为是一家的。新一轮NAND技术竞争|三星V9 TLC、铠侠218层QLC相继量产

三星BM1743是一款企业级QLC SSD,上个月已悄悄推出,其中最高容量版本达到61.44TB。而在2024年闪存峰会上,三星展示了更大的122.88TB版本,并且还展示了几个基准测试记录。

图片

128TB级别的QLC SSD提供了7.5GB/s的顺序读取速度和3GB/s的顺序写入速度。随机读取达到160万IOPS,随机写入为45K IOPS(16KB)。相比前一代产品,BM1743在I/O性能上有4.1倍的提升,数据保留能力有所增强,同时在顺序写入方面提高了45%的能效,三星使用16KB IU来优化闪存管理。


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 13
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古猫先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值