背景介绍
何为电源故障,无论它只是一个小故障、浪涌或完全断电,都可能潜在地损坏存储设备和损坏数据,除非有一个有效的电源失效保护(PLP)机制。
随着越来越多的固态硬盘被部署到企业和工业环境中,必须要有一种有效的断电保护技术来避免意外断电可能带来的危害。
例如,在一个典型的数据中心中,可以部署数百个SSD。在电源故障的情况下,驱动器可能会损坏,导致大量停机,因为驱动器需要重新格式化和重新安装操作系统;数据丢失会对业务运作产生不利影响,并影响客户关系。此外,损坏的驱动器需要更换,这将导致更高的运营成本。
PLP(Power Loss Protection,掉电保护)是一项专为具有SDRAM快取的固态硬盘(Solid State Drive; SSD)量身订作的技术,主机突然断电时,它能维持电压,以确保数据传输的完整性。通过增加电容数量,PLP可以延长时间让资料完成传输。当电源重新被打开后,电容会扮演蓄电电池的角色透过计算机来充电。若电源意外中断,这些充好电的电容会持续供电给SSD,让数据可以完整的被写入。
SSD数据存储
1,主机向SSD发送数据
2,SSD控制器确认已收到数据
3,如果固态硬盘没有SDRAM缓存,存储控制器会将数据转移到NAND闪存,这是一个非易失性存储器,所以即使电源被终止数据也能被安全存储。当SSD中没有SDRAM(外置DDR等)时要考虑主控芯片的内置SDRAM,里面也会存储映射表等一些运行数据,突然掉电也会丢失,也会对SSD性能造成影响。
如果SSD有SDRAM(外置DDR等),运作时,数据、指令、映射表会暂存在SDRAM,利用SDRAM快速反应时间的优势借以提升SSD效能;但SDRAM是易失性存储器,掉电数据丢失。在系统正常关机的情况下,Host端会发送指令给SSD控制器通知电源即将中断,SSD有反应时间可以将暂存于SDRAM的数据存入NAND Flash。然而,当电源无预警中断时,SDRAM里的缓存数据和映像表没有时间写入NAND Flash,因此SSD数据无法正确更新,这就会导致数据遗失、损毁、甚至造成设备故障。主控决定何时将数据从SDRAM缓存中刷到NAND闪存中。
图1
SSD异常掉电通常会出现的故障现象
1、SSD无法重现被系统识别,需要重新构建映射表或者通过简单粗暴的方式重新量产方可使用;
2、多次掉电后,SSD出现大量的“新增坏块”;
出现新增坏块的背后机理是:当SSD对某些Block进行读取、写入或者擦除不成功时,会被标识为坏块,当然,这些块并非真正的坏块,仅仅是因为异常掉电导致的错误判断。
3、SDRAM中数据丢失;
掉电保护技术
1,纯FW(固件)保护
-
SP代码备份。一旦设备通电,临时的系统内编程(ISP)代码就会在一个备用块中生成,以减少对主ISP的读取访问,并降低读取干扰的几率。
-
链接表映射地址备份。上电后,FW将从最新的映射地址中追踪链表。如果发现链表无效,FW将搜索以前的映射地址,直到找到有效的映射地址。映射地址只保存在一个强大的页面</