Background
NVM出现,可以与DRAM一同出现在处理器内存总线上,提高带宽以访问持久性数据。DRAM和NVMM的混合存储系统给设计者带来许多机遇和挑战,如果要充分利用NVMM的高性能,并有效支持更灵活的访问模式,系统需要最小化软件开销,同时必须提供引用程序所需的强有力的一致性保证,并尊重新型存储的限制,eg.有限的写入周期
NVMM的出现给设计者带来以下问题:
- 针对NVMM的软件设计
- NVM的低延迟使得需要平衡硬件和软件的开销。传统的慢的存储设备是影响延迟的主要关键,所以软件开销不是关键因素。使用DAX(Direct Access) 可绕过DRAM 的page cache直接访问NVM。
- 写重排
为了提高性能,处理器及缓存结构可能会对写进行重排序,CPU的内存一致性协议保证了内存更新的顺序,但不提供更新何时到达NVMs的保证,因此电源故障可能会使数据处于不一致状态。如下图所示。虽然NVM可以通过显式刷新缓存和发出内存屏障来执行写顺序,eg.X86架构下提出clflush和mfence指令,但仍存在开销大、不能保证到达NVM顺序的问题。
- 原子性
原子性即要么成功,要么失败,不会是两者的组合。许多应用程序以来于原子的文件系统操作去确保正确性,存储设备通常只提供简单的原子操作(eg.扇区写入),为复杂的原子更新,文件系统需要更复杂的技术。
- 构建复杂的原子操作
已经存在的文件系统使用下述方法提供原子保证,但都存在不同类型的开销。
- 【Journaling】(write-ahead logging) 在应用之前,将所有更新记录到journal中,发生电源故障,重新扫描日志恢复到一致性状态。为提高性能,通常只记录日志元数据。因此,在使用journal的方式下,需要2次写入数据,先写入log,然后写入目标位置。
- 【Shadow paging】不是写时就地更新,而是将受影响页的副本先写道存储设备空的部分,然后通过更新页和根之间的节点将新页连接到文件系统树中,严重依赖它们的树结构来提供原子性。因此,会产生潜在的级联更新的开销
- 【Log-structuring】将对内存的随机写入转化为更大的、顺序的磁盘写入,依赖于顺序写入磁盘的连续空闲区域,因而需要不断GC