NVMe系统内存结构 - Meta Data


本文属于《 NVMe协议基础系列教程》之一,欢迎查看其它文章。

1 为什么需要数据保护

端到端:一端是主机的内存空间,一端是SSD的闪存空间。

我们需要保护的是用户数据。
主机与SSD之间,数据传输的最小单元是逻辑块(Logical Block,LB),每个逻辑块大小可以是512/1024/2048/4096等字节,主机在格式化SSD的时候,逻辑块大小就确定了,之后两者就按这个逻辑块大小进行数据交互。

数据从主机到NVM(Non-Volatile Memory,目前一般是闪存,后面我就用闪存来代表NVM),首先要经过PCIe传输到SSD的控制器,然后控制器把数据写入闪存;反过来,主机想从闪存上读取数据,首先要由SSD控制器从闪存上获得数据,然后经过PCIe把数据传送给主机,如下图所示。
在这里插入图片描述
主机与SSD之间,数据在PCIe上传输的时候,由于信道噪声的存在(说白了就是存在干扰),可能导致数据出错;另外,在SSD内部,控制器与闪存之间,数据也可能发生错误。为确保主机与闪存之间数据的完整性,即主机写入闪存的数据与最初主机写的数据一致,以及主机读到的数据与最初从闪存上读上来的数据一致,NVMe提供了一个端到端的数据保护功能。

2 Meta Data定义

除了逻辑块数据本身,NVMe还允许每个逻辑块带个助理,叫做元数据(Meta Data)。
这个助理的职责,NVMe虽然没有明确要求,但如果数据需要保护,这个助理就必须能充当保镖的角色。

Meta Data结构,如下所示:
在这里插入图片描述

  • Guard:16比特的CRC(Cyclic Redundancy Check),它是逻辑块数据算出来的;
  • Application Tag:这块区域对控制器不可见,为主机所用;
  • Reference Tag:将用户数据和地址(LBA)相关联,防止数据错乱。

CRC校验能够检测出数据是否有错,后者则是保证数据不会出现张冠李戴的问题,比如我读LBA x,结果却读到了LBA y的数据。NVMe数据保护机制能发现这类问题。

因此,Meta Data本质就是,保存了CRC和数据块对应的LBA等冗余信息,进行数据校验,以便及时发现数据错误。

在NVM(I/O)命令和Admin命令的23:16位,Metadata Pointer (MPTR) 字段,就是指向了该命令所对应用户数据的Meta Data区域,如下所示:
在这里插入图片描述
命令中的Metadata Pointer应该Dword对齐。

3 Meta Data传输方式

Meta Data有两种传输方式:

  • Meta Data和逻辑块数据,放一起传输
  • Meta Data和逻辑块数据,分开传输

第一种,是作为逻辑块数据的扩展,和逻辑块数据放一起传输,这是贴身保镖
在这里插入图片描述
第二种,就是逻辑块数据和Meta Data分别传输。虽不是贴身保护,但保镖在附近时刻注意着主人的安全,属于非贴身保镖
在这里插入图片描述
NVMe over Fabrics只支持Meta Data和逻辑数据放一起,即贴身保护。

4 常见Meta Data使用场景

配了Meta Data的数据,如下图所示(以512字节的数据块为例)。
在这里插入图片描述

4.1 不带数据保护信息

在主机与SSD数据传输过程中,NVMe可以让每个逻辑块数据都带上保镖,可以让它们不带保镖,也可以在某个治安差的地方把保镖带上,然后在治安环境好的地方不用保镖。

主机向SSD写入数据,不带保镖,如下图所示。
在这里插入图片描述
什么情况下可以不带保镖?
如果你是普通人,完全没有必要配保镖,原因有:
①你请不起保镖;
②谁有空来伤害你呢?
③太平盛世。

如果是无关紧要的数据(如小电影),完全没有必要进行端到端的保护,毕竟数据保护需要传输额外的数据(每个逻辑数据块需要至少额外8字节的数据保护信息,有效带宽减少),还需要SSD做额外的数据完整性校验(耗时,性能变差)。最关键的是在PCIe通道上,本来就有LCRC的保护,有必要的话还可以使能ECRC,这个跟NVMe关系不大,就不展开了。

4.2 带数据保护信息“数据写”流程

主机向SSD写入数据,全程带上保镖的情况。
在这里插入图片描述
图中的PI(Protection Information,保护信息)就是传说中的保镖。
主机数据通过PCIe传输到SSD控制器时:

  • SSD控制器,会重新计算逻辑块数据的CRC,与保镖的CRC比较,如果两者匹配,说明数据传输是没有问题的;否则,数据就是有问题的,这个时候,SSD控制器就会给主机报错。
  • 除了CRC校验,还要检测有没有张冠李戴的问题,通过检测
    Reference Tag,看看这个没有CRC问题的数据,是不是该主机写命令对应的数据,如果不匹配,同样需要向主机报错。

如果数据检测没有问题,SSD控制器会把逻辑块数据和PI一同写入闪存中。
将PI一同写入闪存中有什么意义呢?
读取的时候有意义。

4.3 带数据保护信息“数据读”流程

在这里插入图片描述
SSD控制器读闪存的时候,会对读上来的数据进行CRC校验,如果写入的时候带有PI,这个时候就能检测出读上来的数据是否正确,从而决定这个数据要不要传给主机。

有人要说,对闪存来说,数据不是受ECC保护吗?为什么还要额外进行数据校验?

没错,写入闪存中的数据是受ECC保护,这个没有问题,但在SSD内部,数据从控制器到闪存之间,一般都要经过DRAM或者SRAM,在之前SSD控制器写入闪存,或者这个时候从闪存读数据到SSD控制器,可能就会发生比特翻转之类的小概率事件,从而导致数据不正确。如果在NVMe层再做个CRC保护,这类数据错误就能被发现了。

除了数据在SSD内发生反转,由于固件问题或者别的原因,还是会出现数据张冠李戴的问题:数据虽然没有CRC错误,但是它不是我们想要的数据。因此,还需要做Reference Tag检测。SSD控制器通过PCIe把数据传给主机,主机端也会对数据进行校验,看SSD返回的数据是否有错。

4.4 SSD内部加入数据保护信息

主机往SSD写入数据,半程带保镖的情况。
在这里插入图片描述
这种情况,主机与控制器端之间是没有数据保护的,因为PCIe已经能提供数据完整性保证了。

但在SSD内部,控制器到闪存之间,由于乱七八糟的原因(数据反转,LBA数据不匹配),存在数据错误的可能,NVMe要求SSD控制器在把数据写入闪存前,计算好数据的PI,然后把数据和PI一同写入闪存。

4.5 SSD内部根据数据保护信息验证数据

SSD控制器读闪存的时候,会对读上来的数据进行PI校验,如果没有问题,剥除PI,然后把逻辑块数据返回给主机;如果校验失败,说明数据存在问题,SSD需要向主机报错,如下图所示。
在这里插入图片描述
数据端到端保护是NVMe的一个特色,其本质就是在数据块中加入CRC和数据块对应的LBA等冗余信息,SSD控制器或者主机端利用这些信息进行数据校验,然后根据校验结果执行相应的操作。加入这些检错信息的好处是能让主机与SSD控制器及时发现数据错误,副作用就是:
1)每个数据块需要额外的至少8字节的数据保护信息,有效带宽减少:数据块越小,带宽影响越大。
2)SSD控制器需要做数据校验,影响性能。


参考文档:

  • 《深入浅出SSD-固态存储核心技术原理与实战》
  • 21
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: NVMe(Non-Volatile Memory Express)是一种基于PCIe总线的高性能存储接口标准。NVMe SCSI(Small Computer System Interface)是在NVMe基础上将SCSI命令映射到NVMe的一种实现方式。 NVMe SCSI是一种在NVMe存储设备上执行SCSI命令的协议。其中,NVMe SCSI Primary Commands - 5是一组用于执行传输数据、控制设备和查询设备信息的SCSI命令。 这组命令包括读取命令(Read Command)、写入命令(Write Command)、写入长命令(Write Long Command)、写入同步命令(Write Synchronization Command)和预取命令(Prefetch Command)。 读取命令用于从存储设备中读取数据。可以通过设置数据传输长度和传输起始位置来指定需要读取的数据范围。 写入命令用于向存储设备中写入数据。与读取命令类似,可以设置数据传输长度和传输起始位置来指定写入的数据范围。 写入长命令用于写入长数据。相比于写入命令,写入长命令支持更大的数据传输长度。 写入同步命令用于在写入数据之前先进行一个或多个同步确认。这样可以确保之前的所有写入操作都完成后再进行下一个写入操作。 预取命令用于指定设备预取机制的信息,以优化读取性能。 总之,NVMe SCSI Primary Commands - 5是一组在NVMe设备上执行SCSI命令的指令集,用于实现数据读取、写入、同步和预取等操作,提供了高性能和效率的存储访问方式。 ### 回答2: NVMe(Non-Volatile Memory Express)是一种高性能存储接口协议,它的SCSI(Small Computer System Interface)主要命令集中的第5个命令被称为NVMe SCSI Primary Command - 5。 具体而言,NVMe SCSI Primary Command - 5是用于完成与NVMe设备通信的主要命令之一。它允许主机与NVMe设备之间进行读写操作,以获取或修改存储在设备上的数据。 通过进行读取操作,NVMe SCSI Primary Command - 5命令可以传输存储在NVMe设备中的数据到主机中。这对于从存储设备中获取文件和信息非常有用。主机可以指定读取的起始地址和读取的数据长度,以确保获取正确的数据。 与读取操作相反,NVMe SCSI Primary Command - 5也支持写入操作。主机可以将数据写入NVMe设备,以便在存储中创建、修改或更新文件和信息。通过指定写入的起始地址和写入的数据长度,主机可以确保写入正确的位置和适当的数据。 总的来说,NVMe SCSI Primary Command - 5命令是与NVMe设备通信的关键命令之一。它通过读取和写入操作,允许主机与NVMe设备之间高效地传输数据。 ### 回答3: NVMe SCSI primary commands - 5,是指NVMe(Non-volatile Memory Express)SCSI(Small Computer System Interface)主要命令的第五个版本。 第五版的NVMe SCSI primary commands扩展了之前版本的功能,提供了更高的性能和更丰富的功能支持。这些命令是用于与NVMe设备进行通信和控制的指令集。 NVMe是一种针对固态存储器(SSD)的高速、低延迟、高吞吐量的连接协议。SCSI是一种通用的存储设备接口,用于连接计算机和外部存储设备。 NVMe SCSI主要命令-5包括了以下几个方面的功能: 1. 带宽管理:命令集提供了更灵活的带宽管理功能,可以根据需要灵活地分配和管理带宽资源,以最大程度地提高系统性能。 2. 多路径支持:命令集扩展了多路径支持的功能,使得在多条路径之间进行负载平衡和故障转移更加灵活和可靠。 3. 电源管理:命令集增加了更多的电源管理命令,以支持设备的低功耗状态和快速唤醒。 4. 安全性增强:命令集引入了更多的安全性增强功能,包括加密、数据完整性保护等,以保护存储数据的安全性。 5. 性能优化:命令集提供了更多的性能优化命令,包括请求队列管理、命令优先级管理等,以提高系统性能和响应速度。 总之,NVMe SCSI主要命令-5是为了更好地满足NVMe设备的高性能和高可靠性需求而设计的指令集。通过扩展功能和提供更多的控制能力,它可以提供更优秀的存储性能和多样化的应用场景支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

百里杨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值