一、I/O设备
1.1 I/O设备的基本概念
- I/O,Input/Output:输入/输出
- I/O 设备:将数据输入到计算机,或者可以接收计算机输出数据的外部设备,属于计算机中的硬件部件
- UNIX系统将外部设备抽象为一种特殊的文件,用户可以使用与文件操作相同的方式对外部设备进行操作
1.2 I/O设备的分类
- 按使用特性分:
- 人机交互类外设(数据传输速度慢):鼠标、键盘、打印机等——用于人机交互
- 存储设备(数据传输速度快):移动硬盘、光盘等——用于数据存储
- 网络通信设备(数据传输速度介于上述二者间):调制解调器等——用于网络通信
- 按传输速率分:
- 低速设备:鼠标、键盘等——传输速率为每秒几个到几百字节
- 中速设备:如激光打印机等——传输速率为每秒数千至上万个字节
- 高速设备:如磁盘等——传输速率为每秒数千字节至千兆字节的设备
- 按信息交换的单位分:
- 块设备(传输速率较高,可寻址,即对它可随机地读/写任一块):如磁盘等——数据传输的基本单位是“块”
- 字符设备(传输速率较慢,不可寻址,在输入/输出时常采用中断驱动方式):鼠标、键盘等——数据传输的基本单位是字符
二、I/O控制
2.1 I/O控制器
- I/O设备:机械部件、电子部件(I/O控制器、设备控制器)
- 机械部件主要用来执行具体I/O操作,如鼠标/键盘的按钮、显示器的LED屏、移动硬盘的磁臂、磁盘盘面
- 电子部件通常是一块插入主板扩充槽的印刷电路板
- CPU无法直接控制I/O设备的机械部件,因此,I/O设备需要一个电子部件作为CPU和I/O设备机械部件之间的“中介”,用于实现CPU对设备的控制,即I/O控制器,又称设备控制器
- CPU控制I/O控制器,又由I/O控制器来控制设备的机械部件
2.1.1 I/O控制器主要功能
- 接受和识别CPU发出的命令:如CPU发来的 read/write 命令,I/O控制器中会有相应的控制寄存器来存放命令和参数
- 向CPU报告设备的状态:I/O控制器中会有相应的状态寄存器,用于记录I/O设备的当前状态,如:1表示空闲,0表示忙碌
- 数据交换:I/O控制器中会设置相应的数据寄存器
- 输出时,数据寄存器用于暂存CPU发来的数据,之后再由控制器传送设备
- 输入时,数据寄存器用于暂存设备发来的数据,之后CPU从数据寄存器中取走数据
- 地址识别:类似于内存的地址,为了区分设备控制器中的各个寄存器,也需要给各个寄存器设置一个特定的“地址”;I/O控制器通过CPU提供的“地址”来判断CPU要读/写的是哪个寄存器
2.1.2 I/O控制器组成
- 一个I/O控制器可能会对应多个设备
- 数据寄存器、控制寄存器、状态寄存器可能有多个(如:每个控制/状态寄存器对应一个具体的设备),且这些寄存器都要有相应的地址,才能方便CPU操作
2.1.3 两种寄存器编址方式
- 有的计算机会让这些寄存器占用内存地址的一部分,称为内存映像I/O
- 另一些计算机则采用I/O专用地址,即寄存器独立编址
2.2 I/O控制方式
2.2.1 程序直接控制方式
- 完成一次读/写操作的流程(Key word:轮询)
- CPU干预的频率很频繁,I/O操作开始之前、完成之后需要CPU介入,并且在等待I/O完成的过程中CPU需要不断地轮询检查
- 数据传送的单位:每次读/写一个字
- 数据的流向:每个字的读/写都需要CPU的帮助
- 读操作(数据输入):I/O设备 → 内存;
- 写操作(数据输出):内存 → 设备
- 主要缺点和主要优点
- 优点:实现简单;在读/写指令之后,加上实现循环检查的一系列指令即可(因此才称为“程序直接控制方式”)
- 缺点:CPU和I/O设备只能串行工作,CPU需要一直轮询检查,长期处于**“忙等”状态** ,CPU利用率低
2.2.2 中断驱动方式
- 完成一次读/写操作的流程(Key word:中断)
- CPU干预的频率
- 每次I/O操作开始之前、完成之后需要CPU介入
- 等待I/O完成的过程中CPU可以切换到别的进程执行
- 数据传送的单位:每次读/写一个字
- 数据的流向
- 读操作(数据输入):I/O设备 → CPU → 内存
- 写操作(数据输出):内存 → CPU → /O设备
- 主要缺点和主要优点
- 优点:与“程序直接控制方式”相比,在“中断驱动方式”中,I/O控制器会通过中断信号主动报告I/O已完成,CPU不再需要不停地轮询;CPU和I/O设备可并行工作,CPU利用率得到明显提升
- 缺点:每个字在I/O设备与内存之间的传输,都需要经过CPU,而频繁的中断处理会消耗较多的CPU时间
2.2.3 DMA方式
- DMA方式( Direct Memory Access,直接存储器存取):主要用于块设备的I/O控制
- 数据的传送单位是“块”,不再是一个字、一个字的传送
- 数据的流向是从设备直接放入内存,或者从内存直接到设备,不再需要CPU作为“快递小哥”
- 仅在传送一个或多个数据块的开始和结束时,才需要CPU干预
- DMA控制器
- 完成一次读/写操作的流程
- CPU干预的频率:仅在传送一个或多个数据块的开始和结束时,才需要CPU干预
- 数据传送的单位:每次读/写一个或多个块(注意:每次读写的只能是连续的多个块,且这些块读入内存后在内存中也必须是连续的)
- 数据的流向(不再需要经过CPU)
- 读操作(数据输入):I/O设备 → 内存
- 写操作(数据输出):内存 → 设备
- 主要缺点和主要优点
- 优点:数据传输以“块”为单位,CPU介入频率进一步降低;数据的传输不再需要先经过CPU再写入内存,数据传输效率进一步增加;CPU和I/O设备的并行性得到提升
- 缺点:CPU每发出一条I/O指令,只能读/写一个或多个连续的数据块;如果要读/写多个离散存储的数据块,或者要将数据分别写到不同的内存区域时,CPU要分别发出多条I/O指令,进行多次中断处理才能完成
2.2.4 通道控制方式
- 通道:一种硬件,可以理解为是 “弱鸡版的CPU”,通道可以识别并执行一系列通道指令
- 与CPU相比,通道可以执行的指令很单一,并且通道程序是放在主机内存中的,也就是说通道与CPU共享内存
- 完成一次读/写操作的流程
- CPU干预的频率极低,通道会根据CPU的指示执行相应的通道程序,只有完成一组数据块的读/写后才需要发出中断信号,请求CPU干预
- 数据传送的单位:每次读/写一组数据块
- 数据的流向(在通道的控制下进行)
- 读操作(数据输入):I/O设备 → 内存
- 写操作(数据输出):内存 → I/O设备
- 主要缺点和主要优点
- 缺点:实现复杂,需要专门的通道硬件支持
- 优点:CPU、通道、I/O设备可并行工作,资源利用率很高
三、I/O软件层次
- 越上面的层次越接近用户;越下面的层次越接近硬件
- 每一层会利用其下层提供的服务,实现某些功能,并屏蔽实现的具体细节,向高层提供服务(“封装思想”)
- 直接涉及到硬件具体细节、且与中断无关的操作肯定是在设备驱动程序层完成的
- 没有涉及硬件的、对各种设备都需要进行的管理工作都是在设备独立性软件层完成的
3.1 I/O软件层次结构
3.1.1 用户层软件
- 用户层软件实现了与用户交互的接口,用户可直接使用该层提供的、与I/O操作相关的库函数对设备进行操作
- 用户层软件将用户请求翻译成格式化的I/O请求,并通过“系统调用”请求操作系统内核的服务
- Windows 操作系统向外提供的一系列系统调用,由于系统调用的格式严格,使用麻烦,因此在用户层上封装了一系列更方便的库函数接口供用户使用(Windows API)
3.1.2 设备独立性软件
- 设备独立性软件,又称设备无关性软件;与设备的硬件特性无关的功能几乎都在这一层实现
- 主要实现的功能:
- 向上层提供统一的调用接口(如 read/write 系统调用)
- 设备的保护:设备被看做是一种特殊的文件,不同用户对设备的访问权限不一样;不同类型的I/O设备需要有不同的驱动程序处理
- 差错处理
- 设备的分配与回收
- 数据缓冲区管理:通过缓冲技术屏蔽设备之间数据交换单位大小和传输速度的差异
- 建立逻辑设备名到物理设备名的映射关系;根据设备类型选择调用相应的驱动程序
- 通过**逻辑设备表(LUT,Logical UnitTable)**确定逻辑设备对应的物理设备,并找到该设备对应的设备驱动程序
- 操作系统系统可以采用两种方式管理逻辑设备表(LUT)
- 整个系统只设置一张LUT,这就意味着所有用户不能使用相同的逻辑设备名,因此这种方式只适用于单用户操作系统
- 为每个用户设置一张LUT,各个用户使用的逻辑设备名可以重复,适用于多用户操作系统;系统会在用户登录时为其建立一个用户管理进程,而LUT就存放在用户管理进程的PCB中
3.1.3 设备驱动程序
- 主要负责对硬件设备的具体控制,将上层发出的一系列命令(如read/write)转化成特定设备“能听得懂”的一系列操作
- 包括设置设备寄存器;检查设备状态等
- 不同的I/O设备有不同的硬件特性,具体细节只有设备的厂家才知道,因此厂家需要根据设备的硬件特性设计并提供相应的驱动程序
- 驱动程序一般会以一个独立进程的方式存在
3.1.4 中断处理程序
- 当I/O任务完成时,I/O控制器会发送一个中断信号,系统会根据中断信号类型找到相应的中断处理程序并执行
- 中断处理程序的处理流程如下:
- 用户通过调用用户层软件提供的库函数发出的I/O请求:
- 用户层软件通过“系统调用”请求设备独立性软件层的服务
- 设备独立性软件层根据LUT调用设备对应的驱动程序
- 驱动程序向I/O控制器发出具体命令
- 等待I/O完成的进程应该被阻塞,因此需要进程切换,而进程切换必然需要中断处理
3.2 程序接口
3.2.1 输入/输出应用程序接口
- 字符设备、块设备、网络设备
- 阻塞I/O:应用程序发出I/O系统调用,进程需转为阻塞态等待;eg:字符设备接口——从键盘读一个字符 get
- 非阻塞I/O:应用程序发出I/O系统调用,系统调用可迅速返回,进程无需阻塞等待;eg:块设备接口——往磁盘写数据 write
3.2.2 设备驱动程序接口
- 不同的操作系统,对设备驱动程序接口的标准各不相同
- 设备厂商必须根据操作系统的接口要求,开发相应的设备驱动程序,设备才能被使用
3.3 I/O核心子系统的重要功能
3.3.1 I/O调度
- I/O调度:用某种算法确定一个好的顺序来处理各个I/O请求,如:磁盘调度(先来先服务算法、最短寻道优先算法、SCAN算法、C-SCAN算法、LOOK算法、C-LOOK算法)
- 当多个磁盘I/O请求到来时,用某种调度算法确定满足I/O请求的顺序
3.3.2 设备保护
- 在UNIX系统中,设备被看做是一种特殊的文件,每个设备也会有对应的FCB
- 当用户请求访问某个设备时,系统根据FCB中记录的信息来判断该用户是否有相应的访问权限,以此实现“设备保护”的功能
四、重要功能
4.1 假脱机技术SPOOLing
4.1.1 脱机技术
- 批处理阶段引入了脱机输入/输出技术:在外围控制机的控制下,慢速输入设备的数据先被输入到更快速的磁带上;之后主机可以从快速的磁带上读入数据,从而缓解了速度矛盾
- “脱机”——脱离主机的控制进行的输入/输出操作
4.1.2 假脱机技术
- 假脱机技术,SPOOLing 技术:用软件的方式模拟脱机技术
- “输入井”模拟脱机输入时的磁带,用于收容I/O设备输入的数据
- “输出井”模拟脱机输出时的磁带,用于收容用户进程输出的数据
- “输入进程”模拟脱机输入时的外围控制机
- “输出进程”模拟脱机输出时的外围控制机
- 实现SPOOLing 技术,必须要有多道程序技术的支持;系统会建立 “输入进程”和 “输出进程”
4.1.3 共享打印机原理分析
- 独占式设备:只允许各个进程串行使用的设备,一段时间内只能满足一个进程的请求
- 共享设备:允许多个进程“同时”使用的设备(宏观上同时使用,微观上可能是交替使用),可同时满足多个进程的使用请求
- 当多个用户进程提出输出打印的请求时,系统会答应它们的请求,由假脱机管理进程为每个进程做两件事
- 在磁盘输出井中为进程申请一个空闲缓冲区,并将要打印的数据送入其中
- 为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中,再将该表挂到假脱机文件队列上
- 当打印机空闲时:输出进程会从文件队列的队头取出一张打印请求表,根据表中的要求将要打印的数据从输出井传送到输出缓冲区,再输出到打印机进行打印
- SPOOLing 技术可以把一台物理设备虚拟成逻辑上的多台设备,可将独占式设备改造成共享设备
4.2 设备的分配与回收
4.2.1 设备分配时的考虑因素
- 设备的固有属性:独占设备、共享设备、虚拟设备。
- 独占设备:一个时段只能分配给一个进程(如打印机)
- 共享设备:可同时分配给多个进程使用(如磁盘),各进程往往是宏观上同时共享使用设备,而微观上交替使用
- 虚拟设备:采用 SPOOLing 技术将独占设备改造成虚拟的共享设备,可同时分配给多个进程使用
- 设备的分配算法:先来先服务、优先级高者优先、短任务优先…
- 设备分配中的安全性
- 安全分配方式:为进程分配一个设备后就将进程阻塞,本次I/O完成后才将进程唤醒
- 优点:破坏了“请求和保持”条件,不会死锁
- 缺点:对于一个进程来说,CPU和I/O设备只能串行工作
- 不安全分配方式:进程发出I/O请求后,系统为其分配I/O设备,进程可继续执行,之后还可以发出新的I/O请求,只有某个I/O请求得不到满足时才将进程阻塞
- 优点:进程的计算任务和I/O任务可以并行处理,使进程迅速推进
- 缺点:有可能发生死锁(死锁避免、死锁的检测和解除)
- 安全分配方式:为进程分配一个设备后就将进程阻塞,本次I/O完成后才将进程唤醒
4.2.2 静态分配与动态分配
- 静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源(破坏了“请求和保持”条件,不会发生死锁)
- 动态分配:进程运行过程中动态申请设备资源
4.2.3 设备分配管理中的数据结构
- 一个通道可控制多个设备控制器,每个设备控制器可控制多个设备
- 设备控制表(DCT):系统为每个设备配置一张DCT,用于记录设备情况
- 设备类型:如:打印机/扫描仪/键盘
- 设备标识符:即物理设备名,系统中的每个设备的物理设备名唯一
- 设备状态:忙碌/空闲/故障…
- 指向控制器表的指针:每个设备由一个控制器控制,该指针可找到相应控制器的信息
- 重复执行次数或时间:当重复执行多次I/O操作后仍不成功,才认为此次I/O失败
- 设备队列的队首指针:指向正在等待该设备的进程队列(由进程PCB组成队列)
- 控制器控制表(COCT):每个设备控制器都会对应一张COCT,操作系统根据COCT的信息对控制器进行操作和管理
- 控制器标识符:各个控制器的唯一ID
- 指向通道表的指针:每个控制器由一个通道控制,该指针可找到相应通道的信息
- 通道控制表(CHCT):每个通道都会对应一张CHCT,操作系统根据CHCT的信息对通道进行操作和管理
- 与通道连接的控制器表首址:可通过该指针找到该通道管理的所有控制器相关信息(COCT)
- 系统设备表(SDT):记录了系统中全部设备的情况,每个设备对应一个表目
4.2.4 设备分配步骤
- 设备分配的步骤:
- 根据进程请求的物理设备名查找SDT(注:物理设备名是进程请求分配设备时提供的参数)
- 根据SDT找到DCT,若设备忙碌则将进程PCB挂到设备等待队列中,不忙碌则将设备分配给进程
- 根据DCT找到COCT,若控制器忙碌则将进程PCB挂到控制器等待队列中,不忙碌则将控制器分配给进程
- 根据COCT找到CHCT,若通道忙碌则将进程PCB挂到通道等待队列中,不忙碌则将通道分配给进程
- 只有设备、控制器、通道三者都分配成功时,这次设备分配才算成功,之后便可启动I/O设备进行数据传送
- 缺点:
- 用户编程时必须使用“物理设备名”,底层细节对用户不透明,不方便编程
- 若换了一个物理设备,则程序无法运行
- 若进程请求的物理设备正在忙碌,则即使系统中还有同类型的设备,进程也必须阻塞等待
- 改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名
4.2.5 设备分配步骤的改进
- 逻辑设备表(LUT)建立了逻辑设备名与物理设备名之间的映射关系
- 某用户进程第一次使用设备时使用逻辑设备名向操作系统发出请求,操作系统根据用户进程指定的设备类型(逻辑设备名)查找系统设备表,找到一个空闲设备分配给进程,并在LUT中增加相应表项
- 如果之后用户进程再次通过相同的逻辑设备名请求使用设备,则操作系统通过LUT表即可知道用户进程实际要使用的是哪个物理设备了,并且也能知道该设备的驱动程序入口地址
- 逻辑设备表的设置问题:
- 整个系统只有一张LUT:各用户所用的逻辑设备名不允许重复,适用于单用户操作系统
- 每个用户一张LUT:不同用户的逻辑设备名可重复,适用于多用户操作系统
4.3 缓冲区管理
4.3.1 缓冲区的概念及功能
- 缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可利用内存作为缓冲区
- 使用硬件作为缓冲区:成本高,容量小,一般仅用在对速度要求非常高的场合(如存储器管理中所用的联想寄存器,由于对页表的访问频率极高,因此使用速度很快的联想寄存器来存放页表项的副本)
- 一般情况下,利用内存作为缓冲区,“设备独立性软件”的缓冲区管理就是要组织管理好这些缓冲区
- 缓冲区的作用
- 缓和CPU与I/O设备之间速度不匹配的矛盾
- 减少对CPU的中断频率,放宽对CPU中断响应时间的限制
- 解决数据粒度不匹配的问题
- 提高CPU与I/O设备之间的并行性
4.3.2 单缓冲
- 操作系统会在主存中为用户进程分配一个缓冲区(若没有特别说明,一个缓冲区的大小就是一个块)
- 当缓冲区数据非空时,不能往缓冲区冲入数据,只能从缓冲区把数据传出
- 当缓冲区为空时,可以往缓冲区冲入数据,但必须把缓冲区充满以后,才能从缓冲区把数据传出
- 假设初始状态为:工作区满,缓冲区空
- 采用单缓冲策略,处理一块数据平均耗时 Max(C, T)+M
- 两台机器之间通信时,可以配置缓冲区用于数据的发送和接受;若两个相互通信的机器只设置单缓冲区,在任一时刻只能实现数据的单向传输
4.3.3 双缓存
- 操作系统会在主存中为其分配两个缓冲区
- 初始状态为:工作区空,其中一个缓冲区满,另一个缓冲区空
- 采用双缓冲策略,处理一个数据块的平均耗时为 Max (T, C+M)
- 两台机器之间通信时,可以配置缓冲区用于数据的发送和接受;若两个相互通信的机器设置双缓冲区,则同一时刻可以实现双向的数据传输
4.3.4 循环缓存
- 将多个大小相等的缓冲区链接成一个循环队列
- in 指针,指向下一个可以冲入数据的空缓冲区
- out 指针,指向下一个可以取出数据的满缓冲区
4.3.5 缓存池
- 缓冲池由系统中共用的缓冲区组成
- 按缓冲区使用状况可以分为:
- 空缓冲队列
- 装满输入数据的缓冲队列(输入队列)
- 装满输出数据的缓冲队列(输出队列)
- 根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区:
- 用于收容输入数据的工作缓冲区(hin)
- 用于提取输入数据的工作缓冲区(sin)
- 用于收容输出数据的工作缓冲区(hout)
- 用于提取输出数据的工作缓冲区(sout)