(十四)块IO层
系统中能够随机访问固定大小数据片的硬件设备称作块设备,这些固定大小的数据片就称作块。最常见的块设备是硬盘,除此以外,还有软盘驱动器、蓝光光驱和闪存等许多其他块设备。它们都是以安装文件系统的方式使用的——这也是块设备一般的访问方式。
块设备
块是文件系统的一种抽象——只能基于块来访问文件系统。
内核要求块大小是2的整数倍,而且不能超过一个页的长度。
缓冲区和缓冲区头
当一个块被调入内存时,它要存储在一个缓冲区中。每个缓冲区与一个块对应,它相当于是磁盘块在内存中的表示。
每一个缓冲区都有一个对应的描述符。该描述符用buffer_head结构体表示,称作缓冲区头。
缓冲区头的目的在于描述磁盘块和物理内存缓冲区之间的映射关系。这个结构体在内核中只扮演一个描述符的角色,说明从缓冲区到块的映射关系。
缓冲区头作为IO操作单元的弊端:
缓冲区头是一个很大且不易控制的数据结构体,而且缓冲区头对数据的操作既不方便也不清晰。在2.6版本中,许多IO操作是通过内核直接对页面或地址空间进行操作来完成,不再使用缓冲区头。
缓冲区头仅能描述单个缓冲区,当作为所有IO的容器使用时,缓冲区头会促使内核把对大块数据的IO操作分解为对多个buffer_head结构体进行操作。这样会造成不必要的负担和空间浪费。
bio结构体
目前内核中块IO操作的基本容器由bio结构体表示,该结构体代表了正在现场的以片段链表形式组织的块IO操作。
即使一个缓冲区分散在内存的多个位置上,bio结构体也能对内核保证IO操作的执行。
缓冲区头和新的bio结构体之间存在显著差别。bio结构体代表的是IO操作,它可以包括内存中的一个或多个页;而另一方面,buffer_head结构体代表的是一个缓冲区,它描述的仅仅是磁盘中的一个块。
还是需要缓冲区头这个概念,毕竟它还负责描述磁盘块到页面的映射。bio结构体不包含任何和缓冲区相关的状态信息——它仅仅是一个矢量数组,描述一个或多个单独块IO操作的数据片段和相关信息。
IO调度程序
为了优化寻址操作,内核既不会简单地按请求接收次序,也不会立即将其提交给磁盘。相反,它会在提交前,先执行名为合并与排序的预操作,这种预操作可以极大地提高系统的整体性能。在内核中负责提交IO请求的子系统称为IO调度程序。
一个IO调度器可能为了提高系统整体性能,而对某些请求不公。
但是通过合并请求,IO调度程序将多次请求的开销压缩成一次请求的开销。更重要的是,请求合并后只需要传递给磁盘一条寻址命令,就可以访问到请求合并前必须多次寻址才能访问完的磁盘区域了,因此合并请求显然能减少系统开销和磁盘寻址次数。