小部分I/O系统软件放在了用户应用层上。
- 库函数(与应用程序链接)
- 假脱机技术(虚拟设备)
- 系统调用与库函数
- 不允许运行在用户态的应用进程,去直接调用运行在核心态(系统态)的OS过程。
- 应用进程在运行时,又必须取得OS所提供的服务。
于是:
-
- OS在用户层中引入了系统调用,应用程序可以通过它,间接调用OS中的I/O过程,对I/O设备进行操作。
待第9章讨论
- 设备分配中的虚拟技术—— SPOOLing技术
- 虚拟性是OS的四大特征之一。
- 多道程序技术将一台物理CPU虚拟为多台逻辑CPU,实现多个用户共享一台主机;
- 如何将一台物理I/O设备虚拟为多台逻辑I/O设备,允许多个用户共享“同时使用” ?
回顾脱机技术
假脱机技术
- 多道程序技术,专门利用程序模拟脱机I/O的外围机,完成设备I/O操作。
- 称这种联机情况下实现的同时外围操作为SPOOLing 技术(Simultaneaus Periphernal Operating On—Line,或称为假脱机操作)
- 一般进程对独占设备的需求被假脱机模拟到磁盘上。所以实现设备虚拟,多道是前提,还需高速、大容量、可随机存取的外存支持。
µSPOOLing系统的组成
主要有三大部分(如下页图)
- 输入井和输出井:磁盘上开辟两大存储空间。输入井模拟脱机输入的磁盘设备,输出井模拟脱机输出时的磁盘。
- 输入缓冲区和输出缓冲区:为缓解速度矛盾,内存中开辟两大缓冲空间,输入缓冲区暂存输入设备送来的数据,再送给输入井;输出缓冲区暂存输出井送来的数据,再送输出设备。
- 输入进程和输出进程。
- 用一进程模拟脱机输入时外围设备控制器的功能,把低速输入设备上的数据传送到高速磁盘上;
- 用另一进程模拟脱机输出时外围设备控制器的功能,把数据从磁盘上传送到低速输出设备上。
- SPOOLing技术的使用:
- 当用户进程请求打印输出时,SPOOLing系统同意为它打印输出,但并不真正立即把打印机分配给用户进程,而只为它做两件事:
- ①由输出进程在输出井中为之请求一个空闲磁盘块区,并将要打印的数据送入其中.
- ②输出进程再为用户进程申请一张空白的用户请求打印表,并将用户的打印要求填入其中,再将该表挂在请求打印队列上.
- 当用户进程请求打印输出时,SPOOLing系统同意为它打印输出,但并不真正立即把打印机分配给用户进程,而只为它做两件事:
- 打印输出过程:
- 如果打印机空闲,输出进程将从请求打印队列的队首取出一张请求打印表,根据表中的要求将要打印的数据,从输出井传送到输出缓冲区,再由打印机进行打印.
- 打印完毕后,输出进程再查看请求打印队列中是否还有等待打印的请求表,如此下去,直至请求打印队列为空,输出进程才将自己阻塞起来.
- 仅当下次再由打印请求时,输出进程才被唤醒.
- 守护进程
- 守护进程(Daemon)是运行在后台 的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。
- Linux的大多数服务器就是用守护进程实现的。比如,Internet服务器inetd,Web服务器httpd等。同时,守护进程完成许多系统任务。比如,作业规划进程crond,打印进程lpd等。
- 利用守护进程实现打印机
- ①为打印机建立一个守护进程,由它执行一部分原来由假脱机管理进程功能的功能。
- ②由请求进程生成一份要求打印的文件,并将用户请求打印文件放入假脱机文件队列(目录)中。
- 打印机属于独占设备,利用SPOOLing技术可将其改造为一台可供多个用户共享的设备。
- 见课本说明:
- 核心就是不能交叉打印的数据,虚拟的打印在磁盘的输出井上(而磁盘的非独占性解决了打印机不能方便共享的问题)。
- 有打印输出请求的进程申请“请求打印表”。
- 数据虚拟打印到“输出井”
- Spooling程序再按“请求表队列”分配真正的打印机打印数据。
- 核心就是不能交叉打印的数据,虚拟的打印在磁盘的输出井上(而磁盘的非独占性解决了打印机不能方便共享的问题)。
SPOOLing系统的特点
- 提高了I/O的速度。利用输入输出井模拟成脱机输入输出,缓和了CPU和I/O设备速度不匹配的矛盾。
- 将独占设备改造为共享设备。并没有为进程分配设备,而是为进程分配一存储区和建立一张I/O请求表。
- 最终,实现了虚拟设备功能。多个进程可“同时”使用一台独占设备。
- 有”控制器”或”通道”的帮助后CPU可解放去做其他事物,提高了利用率。
- 但分析单个程序内的执行
- CPU计算工作需等待后续数据输入才可继续
- CPU计算需等待数据输入完才能计算,虽然数据输入不需CPU干预,但CPU的解放也只是能去做其他程序,需切换工作,会产生开销。
- 一进程中“CPU计算速度”和“设备I/O速度”仍存在不匹配的矛盾。
- 解决:CPU进行当前计算时,设备进行后续数据的输入(——缓冲区)。
缓冲管理
- I/O控制方式减少CPU对I/O的干预提高利用率;
- 缓冲则通过缓和CPU和I/O设备速度不匹配矛盾,增加CPU和I/O设备的并行性,提高利用率。
- 现代OS中,几乎所有的I/O设备与处理机交换数据时,都用了缓冲区。
- 引入缓冲区的主要原因:
- 缓和CPU与I/O设备间速度不匹配的矛盾。
- 缓冲区数据成批传入内存,也可进一步减少对CPU的中断频率
- 最终目的:提高CPU和I/O设备的并行性。
- 使用缓冲区的方式:
1)单缓冲、多缓冲
2)循环缓冲
3)缓冲池(Buffer Pool)
1)单缓冲与多缓冲
- 单缓冲(Single Buffer)
- 每当用户进程发出一I/O请求时,
-
- 单位:字符设备输入时,缓冲区用于暂存用户输入/输出的一行数据;块设备输入则是成块数据。
- 双缓冲(Double Buffer)
- 进一步加快输入和输出速度,提高设备利用率制,也称缓冲对换(Buffer Swapping)
- 输入:数据送入第一缓冲区,装满后转向第二缓冲区。
- 读出:OS从第一缓冲区中移出数据,送入用户进程,再由CPU对数据进行计算。
* 双缓冲还适合双向通讯
- 仅配置单缓冲,任意时刻都只能实现单方向的数据传输,而不允许双方同时向对方发送数据。
- 为实现双向数据传输,需为两台机器中的通讯进程都设置两个缓冲区。定义不同功能:一个用作发送缓冲区,另一个用作接受缓冲区。
多缓冲引入
- I/O与CPU速度基本相匹配,采用双缓冲能获得较好的效果,基本上能并行操作。
- 但,若两者的速度相差甚远,双缓冲的效果仍不够理想;
-
- 循环缓冲的组成
- 多个缓冲区。大小相同,三种类型:
- 预备装输入数据的空缓冲区R
- 装满数据的缓冲区G
- 计算进程正在使用的现行工作缓冲区C
- 多个指针。
- 指示正在使用的缓冲区C的指针Current
- 指示计算进程下一个可取的缓冲区G的指针Nextg
- 指示输入进程下次可放的缓冲区R的指针Nexti
-
- 循环缓冲区的使用
- 计算进程(CPU)和输入进程(I/O操作)可利用两个过程来使用循环缓冲区。
- 主要就是利用指针,操作上述不同类型缓冲区
Getbuf过程:使用缓冲区时,可调用该过程
-
- 计算进程取:current=Nextg,G—>C,nextg下移一个。
- 输入进程放:current=nexti,R—>C,nexti下移一个
Releasebuf过程:
计算进程:C->R
输入进程:C->G
一个时段只能用于输入或输出,不能同时双向通信。
-
- 进程同步
- 两个进程的控制:输入进程和计算进程并行执行,如何控制相应的两个指针不断顺时针方向移动,这样就可能出现两种情况:
- Nexti赶上Nextg。意味着输入速度大于计算速度,缓冲区满,只能阻塞输入进程等计算进程取,此情况称为系统受计算限制。
- Nextg赶上Nexti。意味着输入速度低于计算速度,缓冲区空,只能阻塞计算进程等输入进程放,此情况称为系统受I/O限制。
3)缓冲池(Buffer Pool)
循环缓冲的问题
- 不能同时双向通讯
- 利用率不高。缓冲区是专用缓冲。(每个进程都要维护自己的一个循环缓冲区),使用有剩余时也不给其他进程使用,消耗大量内存空间。
- 系统并发程序很多时,许多这样的循环缓冲需要管理,比较复杂。
为提高缓冲区的利用率,目前广泛流行缓冲池,在池中设置多个可供若干个进程共享的缓冲区。
- 系统将多个缓冲区形成一个缓冲池。
- 池中缓冲区为系统中所有的进程共享使用(如UNIX系统在块设备管理中设置了一个15个缓冲区组成的缓冲池)
组织形式:队列及队列指针
- 缓冲池的组成
- 对于既可输入又可输出的公用缓冲池,至少应含有下列三种类型的缓冲区:
- 空缓冲区;
- 装满输入数据的缓冲区;
- 装满输出数据的缓冲区;
为方便管理,将上述类型相同的缓冲区连成队列
-
- 空缓冲区队列(所有进程都可用)
- 输入队列(n个进程有各自的队列)
- 输出队列(n个进程有各自的队列)
*(队列长度不固定,根据进程实际情况灵活变动,需要多少用多少)
- 工作状态决定了current有四种工作缓冲区:
状态 操作者
-
- 收容输入数据的工作缓冲区;hin
- 提取输入数据的工作缓冲区;sin
- 收容输出数据的工作缓冲区;hout
- 提取输出数据的工作缓冲区;sout
- 缓冲区的工作方式
- 四种工作方式:
- 收容输入:Getbuf(emq),hin;输入数据填入一空缓冲区;Putbuf(inq,hin)
- 提取输入: Getbuf(inq),sin;从输入缓冲队列中取出一数据区的内容;Putbuf(emq,sin)
- 收容输出: Getbuf(emq),hout;输出数据填入一空缓冲区;Putbuf(outq,hout)
- 提取输出: Getbuf(outq),sout;从输出缓冲队列中取一数据区的内容;Putbuf(emq,sout)
缓冲区的使用
- Getbuf(队列,工作区)
- Putbuf(队列,工作区)
- 同步控制
- 每队设置一个互斥信号量MS;
- 判断每个队列是否有可用的缓冲区,需一个资源信号量RS。获取缓冲区时P(RS),释放时V(RS)。
- 磁盘性能简述
- 磁盘调度方法
- 磁盘高速缓存
- 提高速度的其他方法