在VFS层,文件的页高速缓存pagecache,以radix的形式组织管理。pagecache通过具体文件系统能和通用块层对应起来。pagecache与下层块设备的信息交换单位为page (4K)。当写入数据不足一个Page时,VFS会先从底层去读,读一个page。然后将数据写入这个page,最后将page页刷新到块设备。总之就是不足一个page,VFS会自动去底层读了补齐一个page。
那么问题来了,当VFS为了补齐数据自动去底层读,但是读失败了,怎么错误处理呢?
通过实验来说明问题
试验过程:
在Centos6.2系统, 内核2.6.32-279
在VFS层下面的我们植入了自己的虚拟块设备Cache块设备来构建这种情况,实验开始后我们设置Cache块设备为只能写,不能读。
测试文件为大小为1795880Byte,起始写块设备LBA=0, 这样最后一个page凑不了4K,VFS会触发读。
实验结果:
VFS读失败,然后VFS层反复下发读,重试了几十次,最后VFS还是凑了一个Page写到底层块设备,这个Page页是有问题的,因为有一部分无效数据。更有趣的是,VFS把正确的数据填充到了页的末尾,而不是页开始的地方,这样导致我们的测试数据写入的不对,这应该可以算是VFS层错误处理的一个缺陷,不知道新版本的内核有没有修改。我觉得比较好的一种方式将正确的数据从page开始的地方开始填入,这样至少可以保证最后我们写入数据的正确性。
后面有时间分析代码后贴代码。