操作系统理论第八章（磁盘存储器的管理）—第三节（提高磁盘I/O速度的途径）

本文链接：https://blog.csdn.net/Zevalin/article/details/137197664

本文围绕计算机操作系统中的磁盘高速缓存、数据交付策略、置换算法、写回机制，以及提高磁盘I/O速度的方法如提前读、延迟写和优化物理块分布进行了详细讲解，并介绍了RAID技术的各种级别及其优点，包括RAID0至RAID10的性能特点和应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写在前面：

本系列笔记主要以《计算机操作系统（汤小丹…）》为参考，大部分内容出于此书，笔者的工作主要是挑其重点展示，另外配合下方视频链接的教程展开思路，在笔记中一些比较难懂的地方加以自己的一点点理解（重点基本都会有标注，没有任何标注的难懂文字应该是笔者因为强迫症而加进来的，可选择性地忽略）。
视频链接：操作系统（汤小丹等第四版）_哔哩哔哩_bilibili

一、磁盘高速缓存

1、概述

（1）磁盘高速缓存是一组在逻辑上属于磁盘，而物理上是驻留在内存中的盘块。

（2）高速缓存在内存中可分成两种形式：

①在内存中开辟一个单独的存储空间来作为磁盘高速缓存，其大小是固定的，不会受应用程序多少的影响。

②把所有未利用的内存空间变为一个缓冲池，供请求分页系统和磁盘I/O时（作为磁盘高速缓存）共享。

（3）在设计磁盘高速缓存时需要考虑的问题有：

①如何将磁盘高速缓存中的数据传送给请求进程。

②采用什么样的置换策略。

③已修改的盘块数据在何时被写回磁盘。

2、数据交付方式

（1）所谓的数据交付就是指将磁盘高速缓存中的数据传送给请求者进程。

（2）系统可以采取两种方式将数据交付给请求进程：

①数据交付，这是直接将高速缓存中的数据传送到请求者进程的内存工作区中。

②指针交付，只将指向高速缓存中某区域的指针交付给请求者进程。这种方式由于所传送的数据量少，因而节省了数据从磁盘高速缓存存储空间到进程的内存工作区的时间。

3、置换算法

（1）如同请求调页（段）一样，在将磁盘中的盘块数据读入高速缓存时，同样会出现因高速缓存中已装满盘块数据，而需要将其中某些盘块的数据先换出的问题，相应地，也存在着采用哪种置换算法的问题。

（2）常用的置换算法仍然是最近最久未使用算法LRU、最近未使用算法NRU及最少使用算法LFU等。

（3）高速缓存的置换算法时，除了考虑到最近最久未使用这一原则外，还考虑了以下几点：

①访问频率。通常每执行一条指令时便可能访问一次联想存储器，亦即联想存储器的访问频率基本上与指令执行的频率相当，而对磁盘高速缓存的访问频率，则与磁盘I/O的频率相当，因此，对联想存储器的访问频率远远高于对磁盘高速缓存的访问频率。

②可预见性。在磁盘高速缓存中的各盘块数据，有哪些数据可能在较长时间内不会再被访问，又有哪些数据可能很快就再被访问，会有相当一部分是可预知的。

③数据的一致性。由于磁盘高速缓存在内存中，而内存是一种易失性的存储器，一旦系统发生故障，存放在缓存中的数据将会丢失，而其中有些盘块（如索引结点盘块）中的数据已被修改，但尚未拷回磁盘，因此，当系统发生故障后，可能造成数据的不一致性。

4、周期性地写回磁盘

经常被访问的盘块数据一直保存在高速缓存的LRU链中，系统突然发生故障导致数据修改丢失。为了解决这一问题，UNIX系统中专门增设了一个修改程序，周期性（30s）地调用一个系统调用SYNC，该调用的主要功能是强制性地将所有在高速缓存中已修改的盘块数据写回磁盘，这样，因系统故障所造成的工作损失不会超过30s的工作量。。

二、提高磁盘I/O速度的其它方法

1、提前读

用户（进程）对文件进行访问时，经常采用顺序访问方式，即顺序地访问文件各盘块的数据。在读当前块时可以预知下一次要读的盘块，因此可以采取预先读方式，即在读当前块的同时，还要求将下一个盘块（提前读的块）中的数据也读入缓冲区，当下一次要读该盘块中的数据时，由于该数据已被提前读入缓冲区，因而此时便可直接从缓冲区中取得下一盘块的数据，而不需再去启动磁盘I/O，从而大大减少了读数据的时间。

2、延迟写

延迟写是指在缓冲区A中的数据，本应立即写回磁盘，但考虑到该缓冲区中的数据在不久之后可能还会再被本进程或其它进程访问（共享资源），因而并不立即将该缓冲区A中的数据写入磁盘，而是将它挂在空闲缓冲区队列的末尾。随着空闲缓冲区的使用，缓冲区也缓缓往前移动，直至移到空闲缓冲队列之首，当再有进程申请到该缓冲区时，才将该缓冲区中的数据写入磁盘，而把该缓冲区作为空闲缓冲区分配出去。当该缓冲区A仍在队列中时，任何访问该数据的进程，都可直接读出其中的数据而不必去访问磁盘。

3、优化物理块的分布

在采用链接组织和索引组织方式时，可以将一个文件分散在磁盘的任意位置，但如果安排得过于分散，会增加磁头的移动距离。

4、虚拟盘

虚拟盘是指利用内存空间去仿真磁盘，又称为RAM盘。

虚拟盘的主要问题是一旦系统或电源发生故障，虚拟盘中的数据将会丢失，因此虚拟盘常用于存放临时文件，如编译程序所产生的目标程序等。

虚拟盘与磁盘高速缓存的主要区别在于，虚拟盘中的内容完全由用户控制，而高速磁盘缓存中的内容则是由OS控制的。

三、廉价磁盘冗余阵列（RAID）

1、并行交叉存取

为了提高对磁盘的访问速度，已把在大、中型机中应用的交叉存取技术应用到了磁盘存储系统中。在该系统中，有多台磁盘驱动器，系统将每一盘块中的数据分为若干个子盘块数据，再把每一个子盘块的数据分别存储到各个不同磁盘中的相同位置上。以后当要将一个盘块的数据传送到内存时，采取并行传输方式，将各个盘块中的子盘块数据同时向内存中传输，从而使传输时间大大减少。

2、RAID的分级

（1）RAID 0级（无冗余和无校验的数据分块）：

RAID 0提供了并行交叉存取，原理是把连续的数据分散到多个磁盘上存取，数据请求被多个磁盘并行执行，每个磁盘执行属于自己的那部分数据请求。这种数据上的并行操作充分利用总线的带宽，显著提高磁盘整体存取性能，具有最高的I/O性能和最高的磁盘空间利用率，易管理。其缺点是不提供数据冗余，一旦数据损坏，损坏的数据将无法得到恢复。

RAID 0特别适用于对性能要求较高，对数据安全要求低的领域，如图形工作站等；对于个人用户，RAID 0也是提高硬盘存储性能的绝佳选择。

（2）RAID 1级（磁盘镜像阵列）：

RAID 1由磁盘对组成，每个工作盘都有其对应的镜像盘，上面保存着与工作盘完全相同的数据拷贝，具有最高的安全性，但磁盘空间利用率只有50%。RAID 1主要用于存放系统软件、数据及其它重要文件。

（3）RAID 2级（采用纠错海明码的磁盘阵列）：

RAID 2采用海明码纠错技术，用户增加校验盘来提供纠错和验错功能，磁盘驱动器组中的第1个、第2个、第4个......第2n个磁盘驱动器是专门的校验盘，用于校验和纠错，其余的用于存放数据。

RAID2最少要三台磁盘驱动器方能运作。

（4）RAID 3级（采用带奇偶校验码的并行传送）：

RAID 3把数据分成多个“块”，按照奇偶校验算法存放在第N+1个硬盘上，实际数据占用的有效空间为N个硬盘的空间总和，第N+1个硬盘上存储的数据是校验容错信息，当N+1个硬盘中的一个硬盘出现故障时，从其它N个硬盘中的数据可以恢复原始数据，所以RAID 3的安全性是可以得到保障的。

RAID 3比较适合大文件类型且安全性要求较高的应用，如视频编辑、硬盘播放机和大型数据库等。

（5）RAID 4级（带奇偶校验码的独立磁盘结构）：

RAID 4和RAID3很像，唯一不同的是，在数据分割上RAID 3对数据的访问是按位进行的，RAID 4是以数据块为单位。

RAID 4使用一块磁盘作为奇偶校验盘，每次写操作都需要访问奇偶盘，这时奇偶校验盘成为写操作的瓶颈。

（6）RAID 5级（无独立校验盘的奇偶校验码磁盘阵列）：

RAID 5把数据和奇偶校验信息存储到组成RAID 5的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。

当RAID 5的一个磁盘数据损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。

RAID 4和RAID 5使用了独立存取技术，阵列中每一个磁盘都相互独立地操作，所以I/O请求可以并行处理。该技术非常适合于I/O请求率高的应用，不太适用于要求高数据传输率的应用。

（7）RAID 6级（具有独立的数据硬盘与两个独立的分布式校验方案）：

RAID 6技术是在RAID 5基础上，为了进一步加强数据保护而设计的一种RAID方式，是一种扩展RAID 5等级。与RAID 5的不同之处在于，RAID 6除了每个硬盘上都有同级数据XOR校验区外，还有一个针对每个数据块的XOR校验区。当前盘数据块的校验数据不可能存在当前盘，而是交错存储的，每个数据块有了两个校验保护，所以RAID 6的数据冗余性能相当好。

但是，由于增加了一个校验，所以RAID 6写入的效率较RAID 5还差，而且控制系统的设计也更为复杂，第二块的校验区也减少了有效存储空间。

（8）RAID 7级（具有最优化的异步高I/O速率和高数据传输率的磁盘阵列）：

RAID 7等级是至今为止（2022年），理论上性能最高的RAID模式，因为它从组建方式上就已经和以往的方式有了重大的不同。

在RAID 7中，多个硬盘组成一个“柱子”，它们都有各自的通道，在读/写某一区域的数据时，可以迅速定位，而不会因为以往因单个硬盘的限制同一时间只能访问该数据区的一部分。

（9）RAID 10级：

把RAID 0和RAID1技术结合起来，即RAID 0+1 是磁盘分段及镜像的结合，结合了RAID 0及RAID1的优点。它采用两组RAID 0的磁盘阵列互为镜像，也就是它们之间又成为一个RAID 1阵列。