高寿命NVMe SSD应用场景探讨

概述

无论OEM还是系统集成商,在根据NVMe SSD寿命选型是需要考虑业务场景是读密集型、写密集型,还是读写混合型。对于读密集型业务负载,如搜索业务,较低寿命的SSD可以满足需求,但对于写入密集型应用,如缓存系统,读写混合型负载,如OLTP SQL数据库,SSD选型就要考虑高寿命产品。

什么是SSD寿命?

SSD寿命是指在生命周期内允许的数据写入量。按照JEDEC固态技术协会制定的标准JESD218中定义,企业级SSD在到达标称寿命临界值前,必须满足以下条件:

  • SSD标称寿命(建议使用JESD219定义的寿命测试工作负载)
  • SSD的用户容量保持恒定(保证OP不变)
  • 在正常寿命使用期内,不可修复错误率(UBER,Uncorrectable Bit Error Rate)≤ 10E-16
  • FFR ≤ 3%(对应AFR是0.6%,MTBF ≥ 150万小时)
  • SSD关机后,40℃的室温下,数据可以保持3个月

因为SSD使用NAND做为存储介质,SSD的寿命本质上受限于NAND的寿命。NAND寿命的量化指标叫P/E Cycles,也就是写入/擦除(program / erase)次数,因为NAND是以页(page)为单位写入数据,以块(block)为单位擦除,对于已经写入数据的block,必须将原有数据进行搬移,SSD是通过“垃圾回收”(Garbage Collection,GC)的机制来回收被无效数据占用的空闲空间,GC额外搬移的数据需要用到SSD的OP(Over-provisioning)预留空间。对整个block的数据擦除后才能允许新数据写入。一写一擦就会消耗NAND一个P/E。在NAND还是2D平面时代,TLC NAND PE只有500 ~ 1000,但在NAND进入3D堆叠时代后,用于企业级SSD的3D eTLC可以达到5000 ~ 10,000 PE。
在这里插入图片描述

如何计算SSD寿命?

SSD寿命的单位有两种,PBW(或TBW)和 DWPD。

  • PBW/TBW:全称是Petabytes/Terabytes Written,也就是在SSD的生命周期内允许的主机端数据写入量。1PBW = 1000TBW
  • DWPD:全称是Drive Writes Per Day。也就是在生命周期内(一般为5年),SSD每天允许全盘写入的次数。DWPD和PBW/TBW可以相互换算,公式如下:
    在这里插入图片描述

如果用户或OEM厂商知道业务场景下每天的数据写入量是需要对整盘容量写几遍,就可以根据寿命指标,如0.8,1或3 DWPD选型SSD。如果知道工作负载的数据总写入量,就可以根据PBW的寿命指标进行选型。

DWPD的计算和几年生命周期有关,一般生命周期也是产品保修期。以PBlaze5 926系列为例,每天3.4 DWPD写入量对应5年更长的生命周期,但如果每天有5.7 DWPD的写入量,生命周期就会减短到3年。Memblaze PBlaze系列SSD DWPD和PBW寿命标称均是JESD219工作负载下测试得出。
在这里插入图片描述

不同工作负载对SSD寿命的影响

企业应用的工作负载千差万别,而不同工作负载对固态硬盘的寿命有着巨大的影响,其中顺序、纯4K随机和JESD219中定义的IO模型(IO pattern)是三种比较典型的工作负载。而不同工作负载因为数据分布的不同触发“垃圾回收”(GC)的粒度不同。GC在进行无效数据的搬移时会引入额外的系统数据写入,带来写放大WA(Write Amplification),也就是实际用户写一笔数据,真正写入到SSD的可能需要2-3笔。写放大因子(Write Amplification Factor,简称WAF)是NAND总写量除以用户预期的数据写入量的比率,通过WAF可以对WA引入的多余写入量进行量化。
在这里插入图片描述
在这里插入图片描述

从上表也可以清晰看出,不同工作负载测试下SSD WAF不同。WAF=1是最理想状态,但实际的业务场景很少有纯顺序工作负载。因此JESD219对企业级SSD寿命测试工作负载进行了统一,包含从512 bytes到64K,不同权重IO分布的组合,以小块4K IO为主,占有67%的访问,512 bytes占了4%,1K、18K、16K、32K等IO大小都有一定权重。JESD219根据企业级IO模型的特点,还定义了50%的访问集中在前5%的有效空间(热数据),30%的访问集中在接下来15%的有效空间(温数据),20%的访问集中在剩70%的有效空间(冷数据),从这一点也说明企业级的数据冷热度有差异。
在这里插入图片描述

从IO分布看,JESD219相比4K纯随机工作负载差异并不是很大,因为JESD219定义的IO模型4K占比有67%,但由于JESD219中有70%是冷数据,因此会触发磨损均衡(Wear-leveling),针对冷数据的静态磨损均衡(Static Wear-leveling)会引入额外数据搬移,也是JESD219 WA会比纯4K随机负载下略高的原因。不同工作负载影响不同WAF,因此也会影响SSD寿命参数的标称。
在这里插入图片描述

SSD寿命如何查看?

S.M.A.R.T是Self-Monitoring, Analysis and Reporting Technology的缩写,提供NVMe标准和厂商自定义的SMART信息,用于监控 SSD的健康状况,并根据设定的阈值提供预警。SSD寿命可以通过标准nvmecli工具获取SMART信息读取。同样以PBlaze5 920 3.84TB系列为例,寿命相关SMART参数输出如下:

# nvme smart-log /dev/nvme0n1
percentage_used         ,0%        
data_units_written       : 1,287,205  
// 单位是1000 * 512bytes,换算GB为1287205*1000*512bytes /1000/1000/1000 = 659.04896 GB

其中data_units_written可以推算出已经有659.04896 GB用户数据写入SSD,用户容量3.84TB的寿命总写入量是10.52 PBW,所以659 GB的数据写入太毛毛雨,percentage_used显示设备已使用寿命占比仍然为0%,100%代表设备寿命消耗完。

消费级SSD和企业级SSD的寿命有什么不同?

消费级SSD主要定位个人用户,采用消费级NAND,一般PE在3000,OP空间预留较小,寿命标称是TBW级别(后面会对这个参数做详细介绍)。企业级SSD主要定位数据中心批量部署, NAND采用企业级标准,一般NAND PE在7000~10,000,OP空间更大,寿命标称是PBW级别。
在这里插入图片描述
除了寿命的差异,消费级SSD定位个人用户,工作负载压力轻,技术门槛始终,侧重成本和容量,OP空间小,在7%左右,且以中小容量为主,用户对于数据安全和性能一致性要求一般。而企业级SSD适用于企业级数据中心批量部署,研发和质量验证成本高,技术门槛高,在实际应用中,工作负载大,用户对数据安全及产品性能一致性极度严苛的需求。

总结

DWPD和PBW是 NVMe SSD两个重要的寿命指标,反应SSD在生命周期内允许的用户写入量,特别是JESD219负载下的寿命标称,可以帮助NVMe SSD寿命选型。

参考资料:

  • JESD218,Solid-State Drive(SSD)Requirements and Endurance Test Method
  • JESD219,Solid-State Drive(SSD)Endurance Workloads
  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值