为什么说SCM (Storage Class Memory) 越来越重要?

【公众号 乐生活与爱IT 编者Peter Ye 按】

李金星是大普微的副总裁。我和他蛮有缘分的,遇到好几次会议,共同做为演讲嘉宾。今天在听取2021全球闪存峰会李总的《面向当下与未来的高端企业级SSD》的演讲时,对他分享SCM越来越重要的部分,印象深刻,因为数据详实、有力。于是邀请他写一篇相关文章,他转了一篇公众号DapuStor  在2020-06-28发表的文章。

我提炼了一下,有如下4点原因:

1、DRAM和NAND FLASH之间存在比较大的GAP,SCM刚好填补了 ;

2、每个CPU核的可用DRAM容量,每两年降低20~30%

3、CPU获得的DRAM带宽增速,远远不及SSD、网络带宽增速

4、DRAM行业面临scale up瓶颈,因为“制程转进”与“扩大产能”的资本投入性价比越来越低 ;

经过李总的授权,转载如下,原始标题是:《谈谈SCM:DapuStor Haishen3-XL和Optane SSD》,版式略有调整,文字略有删减。

---转载开始---

在存储基础部件领域(Storage & Memory),这两年讨论最多的应属Intel Optane系列,全新的介质、出色的性能、非挥发特性、适中的价格,Optane受到众多存储架构师和数据中心架构师的青睐,Intel也持续大力研发和推广。本文原逻辑在2019年8月的DapuStor Haishen3系列产品发布会上已经讨论过,这里再引申一些内容,抛砖引玉,供大家探讨。

主要有以下内容:

什么是SCM;

为什么说SCM越来越重要(数据中心基础设施在经历什么,存储行业又在经历什么);

DapuStor在思考什么(Optane SSD & Haishen3-XL)。

一、什么是SCM

关于SCM(Storage Class Memory)的定义,个人觉得以下统称比较合适:“介于DRAM和NAND FLASH之间的具备非挥发特性的产品”。因为没有精确的关于SCM参数的定义,我们先来看看DRAM和NAND的一些相关参数:

表:DRAM vs NAND FLASH

可以看到这两者之间存在比较大的GAP,SCM即填补了这个GAP,如下图的产品级图示:

 图:存储层缺口Gap - SCM

二、为什么说SCM越来越重要

1)每个CPU核的可用DRAM容量,每两年降低20~30%

Intel创始人之一的Gordon Moore提出“集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍”,这成为IT产业最著名的摩尔定律,Intel、AMD服务器CPU路线也符合这个发展规律:

表:服务器CPU的发展

但当我们把服务器内存容量的发展趋势和CPU核数放在一起,就能看到其中的问题:

表:服务器CPU & 内存的发展

即“每个服务器CPU核的可用DRAM容量,每两年降低20~30%”,其实服务器CPU对内存的“hungry”是业界的共识:

 图:服务器CPU & 内存的发展

这个趋势从美国阿冈国家实验室超级计算机计划 Argonne National Labs plans也可以看出:

表:阿冈国家实验室HPC计划

2)CPU获得的DRAM带宽增速,远远不及SSD、网络带宽增速

这里直接引用Sandisk Fellow Fritz Kruger的数据,有兴趣的朋友可以搜索“CPU Bandwidth – The Worrisome 2020 Trend”:

图:网络、存储、DRAM趋势(Log scale)

 图:网络、存储、DRAM趋势(Linear scale)

3)DRAM行业面临scale up瓶颈。

熟悉DRAM行业的朋友,都知道DRAM行业经历了一个残酷的厮杀过程:从上世纪80年代的超过20家,到现在的“3大1小”。

在这个行业发展过程中,每一家都在靠以下两种方式竞争:“制程转进”与“扩大产能”。前者即为新工艺的研发,如20nm转往17nm,会带来比如20~30%的bit growth;后者即为更新、增加产线和设备,以增加投片和产出。这两者都需要庞大的资本投入,而在早期资本的投入和整体bit growth基本呈线性关系。

而我们如果拆开来看的话,可以发现随着制程的发展,到了20nm及以下制程后,工艺的转进带来的研发投入增长越来越庞大,大白话是“原来有100块钱,花30块钱更新制程另外70块钱扩产;但是现在更新一个制程需要花70块甚至更高”。

因此,行业近5年虽然资本支出越来越大,但产出bit growth却越来越低,也就是说整个行业面临scale up的瓶颈,资本投入和bit growth并非线性关系,且越来越明显:

图:DRAM行业资本支出和位成长率

DRAM是已经商用的最快的存储介质,从性能特性来说无法被替代,再加上现在行业的寡头局面,任何一个IT OEM厂商或者数据中心,都需要至少3家供应商。如果你是其中一家DRAM供应商,你会怎么想?会不会是“这个生意太好了,慢慢来 :)”。

综合以上各个趋势发展,聪明的架构师们就开始从系统角度来思考这个问题,这也说明了为什么SCM会被委以重任。

具体SCM的使用场景有两种:Caching 和 Tiering,一般情况下Caching相对比较容易实现,而Tiering需要更深入的上下层整合,包括配套的算法,以确保兼顾各Tier的容量比(即成本)和效率。很多大型数据中心和存储厂商都在积极寻找和布局合适Optane SCM的应用场景,比如HPE有“Memory-Driven Flash”(Caching),比如DellEMC PowerMAX支持Tiering。

三、DapuStor在思考什么

DapuStor(深圳大普微电子科技有限公司)致力于打造企业级智能固态硬盘、数据存储处理器芯片及边缘计算相关产品,企业级、数据中心级智能存储基础设施是我们现阶段主要的方向,而在此领域如此重要的SCM产品,当然非常关键。

合作伙伴KIOXIA(原Toshiba)在2018年提出SCM级XL-FLASH发展规划,在接下来的时间里,DapuStor也针对XL-FLASH和KIOXIA进行了长时间的紧密沟通和合作,Haishen3-XL SCM级SSD也确定了如下特性:

 图:DapuStor Haishen3 SCM特性

关于Haishen3-XL和Optane SSD、Z-SSD性能的比较

表:Optane SSD vs Z-SSD vs Haishen3-XL

Optane SSD采用3DXpoint,Z-SSD和Haishen3-XL采用optimized low-latency SLC NAND,从介质上讲3DXpoint已经不是NAND而是PCRAM,是“cross point”型架构,寻址方式、写入过程等与NAND完全不同,不需要垃圾回收,因此Optane SSD RW IOPS有明显优势,另外据说Optane Gen2 会进一步提升至60DWPD,这是从介质改革带来的优势;其它方面Haishen3-XL并不弱。

因此从整体性能方面,low-latency SLC NAND SSD,如Haishen3-XL可在大部分应用场景和Optane SSD共同存在。

DapuStor也在2020年1月份的PM Summit上基于RWW(Real World Workload)对Optane SSD、Haishen3-XL进行了比较,原文链接参考:http://www.dapustor.com/news_view.aspx?nid=2&typeid=139&id=543

关于Haishen3-XL和Optane SSD成本的比较

因为Intel在数据中心CPU领域占绝对垄断地位,针对CPU和Optane、SSD也有类似bundle program优势,因此我们无法估算Optane SSD的to B实际成交价格,仅以电商平台零售价来看还是挺高的:

表:Optane SSD零售价

另一方面,我们粗算一下,能看到3DXpoint Gen1的Wafer成本大概是96L low-latency SLC NAND的2倍:

表:Wafer Cost:TLC vs XL-FLASH vs 3DXpoint vs DRAM

下面再看看Intel 3DXpoint从Micron的采购成本。

从Micron 2020FQ2 Earnings report,可以估算出Micron交付给Intel的3DXpoint业务预计为2B$的6%,即为120M$:

“……Revenue for the CNBU was approximately $2 billion, down approximately1% sequentially and down 17% year-over-year. We have now started to include all 3D XPoint revenue in CNBU reporting, as the use cases for 3D XPoint technology are more closely aligned with memory expansion and this business is being managed by CNBU. Excluding 3D XPoint, CNBU revenue would have been down 7% sequentially……”

而3DXpoint Gen1的产能约为135MGB/Q https://blocksandfiles.com/2019/08/27/3d-xpoint-revenue-forecasts/ :

“……It will output 45m GB/month of Gen 1 XPoint in the fourth quarter and 5m GB/month of Gen 2 XPoint……”

即Intel采购价格约为120M$/135MGB = 0.88$/GB。Intel和Micron的长期合作协议,该价格应该是Micron能提供的最优价,基本符合上面Wafer成本的测算(3DXpoint Gen1 wafer成本大概是96L TLC的10倍).

财务表现上, Intel在Optane上的巨大研发投入,也导致NSG绝大多数财季在亏损。从长期来看,Intel大概率会持续推广Optane产品,随着3DXpoint的使用量越来越多,生产制造成本也会随之降低,形成正循环。

而从一个健康的行业发展来看,现阶段正是需要多个SCM玩家推高市场需求的时期。Low-latency NAND因为基于非常成熟的3D NAND研发生产制造流程,从生态上来说是一个非常合适的SCM产品第二选择,DapuStor也立志成为基于low-latency NAND的优秀SCM解决方案提供商。

说明:文中部分内容涉及对未来的判断,可能和实际会有出入;另外有一些数据是通过参考公开数据推测而来,并非一手数据。若有偏颇还望见谅,有问题欢迎讨论lijinxing@dapustor.com :)

---转载结束

科普小知识:

目前主流的SCM有4类物理介质:PRAM、ReRAM、MRAM和NRAM。

1、PRAM(Phase-Change RAM)

利用特殊合金材料在晶态和非晶态下的导电性差异来表示0或1的状态。结构简单,便于实现大容量和低成本,但对于高温比较敏感。PRAM的寿命和DRAM仍有一定差距,因此一般会采用系统优化的设计。例如,搭配DRAM,形成分级的大容量内存资源池,同时满足高性能和高可靠要求。典型代表为Intel和Micron联合研发的3Dxpoint。

2、ReRAM(Resistive random-access memory)

即阻抗随机存储器,通过在上下电极间施加不同的电压,控制Cell(存储单元)内部导电丝的形成和熔断从而对外呈现不同的阻抗值。由于不同阻抗值可以表示不同状态,故理论容量密度和成本较可观;然而其读写寿命和性能都较低。典型代表厂商为HPE和Crossbar。

3、MRAM(Magnetic Random Access Memory)

即磁性随机存储器,通过电流磁场改变电子自旋方向来表示不同状态,理论性能和寿命都很高,适用于贴近CPU侧的高速缓存(如L2 Cache,LLCache),代表厂商为Toshiba和Everspin。

4、NRAM(Nantero’s CNT Random Access Memory)

即碳纳米管随机存储器,采用碳纳米管作为开关,控制电路通断表示不同的数据状态。由于碳纳米管尺寸非常小并且具备极强的韧性,因此NRAM理论制程可以达到5nm以下,密度和寿命及其优秀,理论功耗也比较低,可用于替代SRAM。当前由Nantero授权其他存储芯片厂商加工。

————————————————

版权声明:本文为CSDN博主「kawlyh」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/kawlyh/article/details/106197682

扩展阅读:

深入剖析NVMe Over Fabrics

详解:什么是NVMe?

Why NVMe ?

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
EEPROM是可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory)的简称,而SMIC18则是指中国大陆的半导体制造企业SMIC(中芯国际)所采用的18纳米制程。在这个问题中,eeprom smic18的意思是指在SMIC18制程下生产的EEPROM芯片。 EEPROM是一种常见的非易失性存储器,可以在电源关闭后保持存储数据完整而不丢失。它可以通过电压编程来改变存储的数据,并且可以通过电压擦除来清除已存储的数据。这使得EEPROM非常适合用于存储小量的数据,例如配置信息、校准数据或用户设定。 SMIC18是由SMIC生产的18纳米制程,是一种先进的半导体制造技术。制程越小,元件尺寸越小,功能越强大,功耗和热量也相应降低。SMIC18制程在性能、功耗和成本之间取得了良好的平衡,适用于制造各种类型的半导体器件,如存储器、逻辑门、模拟器件等。 将EEPROM与SMIC18结合在一起,意味着使用SMIC18制程来制造EEPROM芯片。这样做的好处是,SMIC18制程可以提供更小的尺寸和更高的集成度,从而使EEPROM芯片更加紧凑和高效。同时,SMIC18制程也可以提供良好的电性能和高可靠性,从而增强EEPROM芯片的性能和稳定性。 总结而言,eeprom smic18是指在SMIC18制程下生产的EEPROM芯片。这种组合可以提供更小、更高效、更可靠的非易失性存储解决方案,适用于各种应用领域,如消费电子、汽车电子、通信设备等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值