【王道·操作系统】第五章输入输出管理

啊有礼貌

已于 2023-07-02 03:12:38 修改

阅读量507

点赞数

分类专栏：操作系统文章标签：操作系统 I/O 缓存硬件架构算法

于 2023-07-01 01:37:41 首次发布

本文链接：https://blog.csdn.net/qq_43143469/article/details/131484718

版权

操作系统专栏收录该内容

6 篇文章 5 订阅

订阅专栏

一、I/O设备

在这里插入图片描述

1.1 I/O设备的基本概念

I/O，Input/Output：输入/输出
I/O 设备：将数据输入到计算机，或者可以接收计算机输出数据的外部设备，属于计算机中的硬件部件
UNIX系统将外部设备抽象为一种特殊的文件，用户可以使用与文件操作相同的方式对外部设备进行操作

1.2 I/O设备的分类

按使用特性分：
- 人机交互类外设（数据传输速度慢）：鼠标、键盘、打印机等——用于人机交互
- 存储设备（数据传输速度快）：移动硬盘、光盘等——用于数据存储
- 网络通信设备（数据传输速度介于上述二者间）：调制解调器等——用于网络通信
按传输速率分：
- 低速设备：鼠标、键盘等——传输速率为每秒几个到几百字节
- 中速设备：如激光打印机等——传输速率为每秒数千至上万个字节
- 高速设备：如磁盘等——传输速率为每秒数千字节至千兆字节的设备
按信息交换的单位分：
- 块设备（传输速率较高，可寻址，即对它可随机地读/写任一块）：如磁盘等——数据传输的基本单位是“块”
- 字符设备（传输速率较慢，不可寻址，在输入/输出时常采用中断驱动方式）：鼠标、键盘等——数据传输的基本单位是字符

二、I/O控制

2.1 I/O控制器

在这里插入图片描述

I/O设备：机械部件、电子部件（I/O控制器、设备控制器）
- 机械部件主要用来执行具体I/O操作，如鼠标/键盘的按钮、显示器的LED屏、移动硬盘的磁臂、磁盘盘面
- 电子部件通常是一块插入主板扩充槽的印刷电路板
CPU无法直接控制I/O设备的机械部件，因此，I/O设备需要一个电子部件作为CPU和I/O设备机械部件之间的“中介”，用于实现CPU对设备的控制，即I/O控制器，又称设备控制器
CPU控制I/O控制器，又由I/O控制器来控制设备的机械部件

2.1.1 I/O控制器主要功能

接受和识别CPU发出的命令：如CPU发来的 read/write 命令，I/O控制器中会有相应的控制寄存器来存放命令和参数
向CPU报告设备的状态：I/O控制器中会有相应的状态寄存器，用于记录I/O设备的当前状态，如：1表示空闲，0表示忙碌
数据交换：I/O控制器中会设置相应的数据寄存器
- 输出时，数据寄存器用于暂存CPU发来的数据，之后再由控制器传送设备
- 输入时，数据寄存器用于暂存设备发来的数据，之后CPU从数据寄存器中取走数据
地址识别：类似于内存的地址，为了区分设备控制器中的各个寄存器，也需要给各个寄存器设置一个特定的“地址”；I/O控制器通过CPU提供的“地址”来判断CPU要读/写的是哪个寄存器

2.1.2 I/O控制器组成

在这里插入图片描述

一个I/O控制器可能会对应多个设备
数据寄存器、控制寄存器、状态寄存器可能有多个（如：每个控制/状态寄存器对应一个具体的设备），且这些寄存器都要有相应的地址，才能方便CPU操作

2.1.3 两种寄存器编址方式

有的计算机会让这些寄存器占用内存地址的一部分，称为内存映像I/O
另一些计算机则采用I/O专用地址，即寄存器独立编址

2.2 I/O控制方式

在这里插入图片描述

2.2.1 程序直接控制方式

完成一次读/写操作的流程（Key word：轮询）
CPU干预的频率很频繁，I/O操作开始之前、完成之后需要CPU介入，并且在等待I/O完成的过程中CPU需要不断地轮询检查
数据传送的单位：每次读/写一个字
数据的流向：每个字的读/写都需要CPU的帮助
- 读操作（数据输入）：I/O设备 → 内存；
- 写操作（数据输出）：内存 → 设备
主要缺点和主要优点
- 优点：实现简单；在读/写指令之后，加上实现循环检查的一系列指令即可（因此才称为“程序直接控制方式”）
- 缺点：CPU和I/O设备只能串行工作，CPU需要一直轮询检查，长期处于**“忙等”状态** ，CPU利用率低

2.2.2 中断驱动方式

完成一次读/写操作的流程（Key word：中断）
CPU干预的频率
- 每次I/O操作开始之前、完成之后需要CPU介入
- 等待I/O完成的过程中CPU可以切换到别的进程执行
数据传送的单位：每次读/写一个字
数据的流向
- 读操作（数据输入）：I/O设备 → CPU → 内存
- 写操作（数据输出）：内存 → CPU → /O设备
主要缺点和主要优点
- 优点：与“程序直接控制方式”相比，在“中断驱动方式”中，I/O控制器会通过中断信号主动报告I/O已完成，CPU不再需要不停地轮询；CPU和I/O设备可并行工作，CPU利用率得到明显提升
- 缺点：每个字在I/O设备与内存之间的传输，都需要经过CPU，而频繁的中断处理会消耗较多的CPU时间

2.2.3 DMA方式

DMA方式（ Direct Memory Access，直接存储器存取）：主要用于块设备的I/O控制
1. 数据的传送单位是“块”，不再是一个字、一个字的传送
2. 数据的流向是从设备直接放入内存，或者从内存直接到设备，不再需要CPU作为“快递小哥”
3. 仅在传送一个或多个数据块的开始和结束时，才需要CPU干预
DMA控制器

完成一次读/写操作的流程
CPU干预的频率：仅在传送一个或多个数据块的开始和结束时，才需要CPU干预
数据传送的单位：每次读/写一个或多个块（注意：每次读写的只能是连续的多个块，且这些块读入内存后在内存中也必须是连续的）
数据的流向（不再需要经过CPU）
- 读操作（数据输入）：I/O设备 → 内存
- 写操作（数据输出）：内存 → 设备
主要缺点和主要优点
- 优点：数据传输以“块”为单位，CPU介入频率进一步降低；数据的传输不再需要先经过CPU再写入内存，数据传输效率进一步增加；CPU和I/O设备的并行性得到提升
- 缺点：CPU每发出一条I/O指令，只能读/写一个或多个连续的数据块；如果要读/写多个离散存储的数据块，或者要将数据分别写到不同的内存区域时，CPU要分别发出多条I/O指令，进行多次中断处理才能完成

2.2.4 通道控制方式

通道：一种硬件，可以理解为是 “弱鸡版的CPU”，通道可以识别并执行一系列通道指令
与CPU相比，通道可以执行的指令很单一，并且通道程序是放在主机内存中的，也就是说通道与CPU共享内存

完成一次读/写操作的流程
CPU干预的频率极低，通道会根据CPU的指示执行相应的通道程序，只有完成一组数据块的读/写后才需要发出中断信号，请求CPU干预
数据传送的单位：每次读/写一组数据块
数据的流向（在通道的控制下进行）
- 读操作（数据输入）：I/O设备 → 内存
- 写操作（数据输出）：内存 → I/O设备
主要缺点和主要优点
- 缺点：实现复杂，需要专门的通道硬件支持
- 优点：CPU、通道、I/O设备可并行工作，资源利用率很高

三、I/O软件层次

在这里插入图片描述

越上面的层次越接近用户；越下面的层次越接近硬件
每一层会利用其下层提供的服务，实现某些功能，并屏蔽实现的具体细节，向高层提供服务（“封装思想”）
直接涉及到硬件具体细节、且与中断无关的操作肯定是在设备驱动程序层完成的
没有涉及硬件的、对各种设备都需要进行的管理工作都是在设备独立性软件层完成的

3.1 I/O软件层次结构

3.1.1 用户层软件

用户层软件实现了与用户交互的接口，用户可直接使用该层提供的、与I/O操作相关的库函数对设备进行操作
用户层软件将用户请求翻译成格式化的I/O请求，并通过“系统调用”请求操作系统内核的服务
Windows 操作系统向外提供的一系列系统调用，由于系统调用的格式严格，使用麻烦，因此在用户层上封装了一系列更方便的库函数接口供用户使用（Windows API）

3.1.2 设备独立性软件

设备独立性软件，又称设备无关性软件；与设备的硬件特性无关的功能几乎都在这一层实现
主要实现的功能：
1. 向上层提供统一的调用接口（如 read/write 系统调用）
2. 设备的保护：设备被看做是一种特殊的文件，不同用户对设备的访问权限不一样；不同类型的I/O设备需要有不同的驱动程序处理
3. 差错处理
4. 设备的分配与回收
5. 数据缓冲区管理：通过缓冲技术屏蔽设备之间数据交换单位大小和传输速度的差异
6. 建立逻辑设备名到物理设备名的映射关系；根据设备类型选择调用相应的驱动程序
通过**逻辑设备表（LUT，Logical UnitTable）**确定逻辑设备对应的物理设备，并找到该设备对应的设备驱动程序
操作系统系统可以采用两种方式管理逻辑设备表（LUT）
- 整个系统只设置一张LUT，这就意味着所有用户不能使用相同的逻辑设备名，因此这种方式只适用于单用户操作系统
- 为每个用户设置一张LUT，各个用户使用的逻辑设备名可以重复，适用于多用户操作系统；系统会在用户登录时为其建立一个用户管理进程，而LUT就存放在用户管理进程的PCB中

3.1.3 设备驱动程序

主要负责对硬件设备的具体控制，将上层发出的一系列命令（如read/write）转化成特定设备“能听得懂”的一系列操作
包括设置设备寄存器；检查设备状态等
不同的I/O设备有不同的硬件特性，具体细节只有设备的厂家才知道，因此厂家需要根据设备的硬件特性设计并提供相应的驱动程序
驱动程序一般会以一个独立进程的方式存在

3.1.4 中断处理程序

当I/O任务完成时，I/O控制器会发送一个中断信号，系统会根据中断信号类型找到相应的中断处理程序并执行
中断处理程序的处理流程如下：
用户通过调用用户层软件提供的库函数发出的I/O请求：
- 用户层软件通过“系统调用”请求设备独立性软件层的服务
- 设备独立性软件层根据LUT调用设备对应的驱动程序
- 驱动程序向I/O控制器发出具体命令
- 等待I/O完成的进程应该被阻塞，因此需要进程切换，而进程切换必然需要中断处理

3.2 程序接口

3.2.1 输入/输出应用程序接口

字符设备、块设备、网络设备
阻塞I/O：应用程序发出I/O系统调用，进程需转为阻塞态等待；eg：字符设备接口——从键盘读一个字符 get
非阻塞I/O：应用程序发出I/O系统调用，系统调用可迅速返回，进程无需阻塞等待；eg：块设备接口——往磁盘写数据 write

3.2.2 设备驱动程序接口

不同的操作系统，对设备驱动程序接口的标准各不相同
设备厂商必须根据操作系统的接口要求，开发相应的设备驱动程序，设备才能被使用

3.3 I/O核心子系统的重要功能

在这里插入图片描述

3.3.1 I/O调度

I/O调度：用某种算法确定一个好的顺序来处理各个I/O请求，如：磁盘调度（先来先服务算法、最短寻道优先算法、SCAN算法、C-SCAN算法、LOOK算法、C-LOOK算法）
当多个磁盘I/O请求到来时，用某种调度算法确定满足I/O请求的顺序

3.3.2 设备保护

在UNIX系统中，设备被看做是一种特殊的文件，每个设备也会有对应的FCB
当用户请求访问某个设备时，系统根据FCB中记录的信息来判断该用户是否有相应的访问权限，以此实现“设备保护”的功能

四、重要功能

4.1 假脱机技术SPOOLing

在这里插入图片描述

4.1.1 脱机技术

批处理阶段引入了脱机输入/输出技术：在外围控制机的控制下，慢速输入设备的数据先被输入到更快速的磁带上；之后主机可以从快速的磁带上读入数据，从而缓解了速度矛盾
“脱机”——脱离主机的控制进行的输入/输出操作

4.1.2 假脱机技术

在这里插入图片描述

假脱机技术，SPOOLing 技术：用软件的方式模拟脱机技术
- “输入井”模拟脱机输入时的磁带，用于收容I/O设备输入的数据
- “输出井”模拟脱机输出时的磁带，用于收容用户进程输出的数据
- “输入进程”模拟脱机输入时的外围控制机
- “输出进程”模拟脱机输出时的外围控制机
实现SPOOLing 技术，必须要有多道程序技术的支持；系统会建立 “输入进程”和 “输出进程”

4.1.3 共享打印机原理分析

独占式设备：只允许各个进程串行使用的设备，一段时间内只能满足一个进程的请求
共享设备：允许多个进程“同时”使用的设备（宏观上同时使用，微观上可能是交替使用），可同时满足多个进程的使用请求
当多个用户进程提出输出打印的请求时，系统会答应它们的请求，由假脱机管理进程为每个进程做两件事
- 在磁盘输出井中为进程申请一个空闲缓冲区，并将要打印的数据送入其中
- 为用户进程申请一张空白的打印请求表，并将用户的打印请求填入表中，再将该表挂到假脱机文件队列上
当打印机空闲时：输出进程会从文件队列的队头取出一张打印请求表，根据表中的要求将要打印的数据从输出井传送到输出缓冲区，再输出到打印机进行打印
SPOOLing 技术可以把一台物理设备虚拟成逻辑上的多台设备，可将独占式设备改造成共享设备

4.2 设备的分配与回收

在这里插入图片描述

4.2.1 设备分配时的考虑因素

设备的固有属性：独占设备、共享设备、虚拟设备。
- 独占设备：一个时段只能分配给一个进程（如打印机）
- 共享设备：可同时分配给多个进程使用（如磁盘），各进程往往是宏观上同时共享使用设备，而微观上交替使用
- 虚拟设备：采用 SPOOLing 技术将独占设备改造成虚拟的共享设备，可同时分配给多个进程使用
设备的分配算法：先来先服务、优先级高者优先、短任务优先…
设备分配中的安全性
- 安全分配方式：为进程分配一个设备后就将进程阻塞，本次I/O完成后才将进程唤醒
  - 优点：破坏了“请求和保持”条件，不会死锁
  - 缺点：对于一个进程来说，CPU和I/O设备只能串行工作
- 不安全分配方式：进程发出I/O请求后，系统为其分配I/O设备，进程可继续执行，之后还可以发出新的I/O请求，只有某个I/O请求得不到满足时才将进程阻塞
  - 优点：进程的计算任务和I/O任务可以并行处理，使进程迅速推进
  - 缺点：有可能发生死锁（死锁避免、死锁的检测和解除）

4.2.2 静态分配与动态分配

静态分配：进程运行前为其分配全部所需资源，运行结束后归还资源（破坏了“请求和保持”条件，不会发生死锁）
动态分配：进程运行过程中动态申请设备资源

4.2.3 设备分配管理中的数据结构

一个通道可控制多个设备控制器，每个设备控制器可控制多个设备
设备控制表（DCT）：系统为每个设备配置一张DCT，用于记录设备情况
- 设备类型：如：打印机/扫描仪/键盘
- 设备标识符：即物理设备名，系统中的每个设备的物理设备名唯一
- 设备状态：忙碌/空闲/故障…
- 指向控制器表的指针：每个设备由一个控制器控制，该指针可找到相应控制器的信息
- 重复执行次数或时间：当重复执行多次I/O操作后仍不成功，才认为此次I/O失败
- 设备队列的队首指针：指向正在等待该设备的进程队列（由进程PCB组成队列）
控制器控制表（COCT）：每个设备控制器都会对应一张COCT，操作系统根据COCT的信息对控制器进行操作和管理
- 控制器标识符：各个控制器的唯一ID
- 指向通道表的指针：每个控制器由一个通道控制，该指针可找到相应通道的信息
通道控制表（CHCT）：每个通道都会对应一张CHCT，操作系统根据CHCT的信息对通道进行操作和管理
- 与通道连接的控制器表首址：可通过该指针找到该通道管理的所有控制器相关信息（COCT）
系统设备表（SDT）：记录了系统中全部设备的情况，每个设备对应一个表目

4.2.4 设备分配步骤

设备分配的步骤：
1. 根据进程请求的物理设备名查找SDT（注：物理设备名是进程请求分配设备时提供的参数）
2. 根据SDT找到DCT，若设备忙碌则将进程PCB挂到设备等待队列中，不忙碌则将设备分配给进程
3. 根据DCT找到COCT，若控制器忙碌则将进程PCB挂到控制器等待队列中，不忙碌则将控制器分配给进程
4. 根据COCT找到CHCT，若通道忙碌则将进程PCB挂到通道等待队列中，不忙碌则将通道分配给进程
只有设备、控制器、通道三者都分配成功时，这次设备分配才算成功，之后便可启动I/O设备进行数据传送
缺点：
- 用户编程时必须使用“物理设备名”，底层细节对用户不透明，不方便编程
- 若换了一个物理设备，则程序无法运行
- 若进程请求的物理设备正在忙碌，则即使系统中还有同类型的设备，进程也必须阻塞等待
改进方法：建立逻辑设备名与物理设备名的映射机制，用户编程时只需提供逻辑设备名

4.2.5 设备分配步骤的改进

逻辑设备表（LUT）建立了逻辑设备名与物理设备名之间的映射关系
某用户进程第一次使用设备时使用逻辑设备名向操作系统发出请求，操作系统根据用户进程指定的设备类型（逻辑设备名）查找系统设备表，找到一个空闲设备分配给进程，并在LUT中增加相应表项
如果之后用户进程再次通过相同的逻辑设备名请求使用设备，则操作系统通过LUT表即可知道用户进程实际要使用的是哪个物理设备了，并且也能知道该设备的驱动程序入口地址
逻辑设备表的设置问题：
- 整个系统只有一张LUT：各用户所用的逻辑设备名不允许重复，适用于单用户操作系统
- 每个用户一张LUT：不同用户的逻辑设备名可重复，适用于多用户操作系统

4.3 缓冲区管理

在这里插入图片描述

4.3.1 缓冲区的概念及功能

缓冲区是一个存储区域，可以由专门的硬件寄存器组成，也可利用内存作为缓冲区
- 使用硬件作为缓冲区：成本高，容量小，一般仅用在对速度要求非常高的场合（如存储器管理中所用的联想寄存器，由于对页表的访问频率极高，因此使用速度很快的联想寄存器来存放页表项的副本）
- 一般情况下，利用内存作为缓冲区，“设备独立性软件”的缓冲区管理就是要组织管理好这些缓冲区
缓冲区的作用
- 缓和CPU与I/O设备之间速度不匹配的矛盾
- 减少对CPU的中断频率，放宽对CPU中断响应时间的限制
- 解决数据粒度不匹配的问题
- 提高CPU与I/O设备之间的并行性

4.3.2 单缓冲

操作系统会在主存中为用户进程分配一个缓冲区（若没有特别说明，一个缓冲区的大小就是一个块）
当缓冲区数据非空时，不能往缓冲区冲入数据，只能从缓冲区把数据传出
当缓冲区为空时，可以往缓冲区冲入数据，但必须把缓冲区充满以后，才能从缓冲区把数据传出
假设初始状态为：工作区满，缓冲区空
采用单缓冲策略，处理一块数据平均耗时 Max(C, T)+M
两台机器之间通信时，可以配置缓冲区用于数据的发送和接受；若两个相互通信的机器只设置单缓冲区，在任一时刻只能实现数据的单向传输

4.3.3 双缓存

操作系统会在主存中为其分配两个缓冲区
初始状态为：工作区空，其中一个缓冲区满，另一个缓冲区空
采用双缓冲策略，处理一个数据块的平均耗时为 Max (T, C+M)
两台机器之间通信时，可以配置缓冲区用于数据的发送和接受；若两个相互通信的机器设置双缓冲区，则同一时刻可以实现双向的数据传输

4.3.4 循环缓存

将多个大小相等的缓冲区链接成一个循环队列
in 指针，指向下一个可以冲入数据的空缓冲区
out 指针，指向下一个可以取出数据的满缓冲区

4.3.5 缓存池

缓冲池由系统中共用的缓冲区组成
按缓冲区使用状况可以分为：
- 空缓冲队列
- 装满输入数据的缓冲队列（输入队列）
- 装满输出数据的缓冲队列（输出队列）
根据一个缓冲区在实际运算中扮演的功能不同，又设置了四种工作缓冲区：
- 用于收容输入数据的工作缓冲区（hin）
- 用于提取输入数据的工作缓冲区（sin）
- 用于收容输出数据的工作缓冲区（hout）
- 用于提取输出数据的工作缓冲区（sout）