一、处理机调度相关基本概念
- 处理机调度:多道程序环境下,动态的把处理机分配给就绪队列中的一个进程使之执行。
作业进入系统驻留在外存的后备队列上,再至调入内存运行完毕,可能要经历下述三级调度。
-
1、高级调度(High Scheduling)
又称作业调度或长程调度(Long-Term Scheduling),接纳调度(Admission Scheduling)
主要在早期批处理阶段,处理在外存上的作业。决定外存后备队列中的哪些作业调入内存;
为它们创建进程、分配必要的资源;
将新创建的进程排在就绪队列上,准备执行。管理的方面比较多。*
在每次执行作业调度时,都须作出两个决定:
接纳多少作业——取决于多道程序度。应根据系统的规模和运行速度等情况综合考虑。
接纳哪些作业——取决于采用的调度算法。如先来先服务,短作业优先等(后面详细介绍)
系统运行并不一定存在高级调度
批处理系统:作业进入系统后先驻留外存,故需要有作业调度。
分时系统:为及时响应,作业由终端直接送入内存,故不需作业调度。
实时系统中,通常也不需作业调度。
-
2、低级调度(Low Level Scheduling)
也称为进程调度、微观调度或短程调度(Short-Term Scheduling)
决定内存就绪队列中的哪个进程获得处理机,进行分配工作。是最基本的一种调度,在三种基本OS中都有。1)非抢占方式(Non-preemptive Mode)
一旦处理机分配给某进程,该进程一直执行。决不允许其他进程抢占已分配运行进程的处理机。
2)抢占方式(Preemptive Mode)
允许调度程序根据某种原则,暂停某个正在执行的进程,将处理机重新分配给另一进程。
可引起进程调度的原因:
进程运行结束
进入阻塞状态
时间片用完
有更高优先级的进程进入就绪队列
- 3、中级调度(Intermediate-Level Scheduling)
又称交换调度或中程调度(Medium-Term Scheduling)
引入目的:提高内存利用率和系统吞吐量。根据条件将一些进程调出或再调入内存。
-
4、调度队列模型
不论高级、中级或者低级调度,都涉及到进程队列,由此形成了三类调度队列模型。从这三种方式中体验调度的过程。仅有进程调度的调度队列模型
常见情况:
分时系统。
通常仅设置进程调度,用户键入的命令和数据,都直接送入内存。调度对象:
处于就绪状态的进程。组织形式:
栈、树或一个无序链表
用何种形式取决于OS类型和采用的调度算法。
具有高级和低级调度的调度队列模型
同时具有三级调度的调度队列模型
引入中级调度后,进程的状态变化:
就绪状态:分为内存就绪和外存就绪。
阻塞状态:分为内存阻塞和外存阻塞。
中级调度使进程在上述状态间变化,并使数据在内外存间互换。 -
5.选择调度方式和调度算法的若干准则
1)面向用户的准则
周转时间短
响应时间快
均衡性
截止时间的保证
优先权准则2)面向系统的准则
系统吞吐量高:批处理系统的重要指标。
单位时间内所完成的作业数,跟作业本身(与作业平均长度密切相关)和调度算法都有关系;
处理机利用率好(主要针对大中型主机)
各类资源的平衡利用(主要针对大中型主机)
不同系统需求各有侧重
-
批处理系统
平均周转时间短
系统吞吐量高
处理机利用率好 -
分时系统
响应时间快
均衡 -
实时系统
截至时间的保证
可预测性
二、常用调度算法
调度的实质就是一种资源分配。不同的系统和系统目标,通常采用不同的调度算法——适合自己的才是最好的。
如批处理系统为照顾为数众多的短作业,应采用短作业优先的调度算法;
如分时系统为保证系统具有合理的响应时间,应采用轮转法进行调度。
目前存在的多种调度算法中,有的算法适用于作业调度,有的算法适用于进程调度;但有些算法作业调度和进程调度都可以采用。
1、先来先服务调度算法FCFS(First Come First Service)
最简单,既可用于作业调度,也可用于进程调度,按先后顺序进行调度
默认非抢占方式
不利于短作业
关于应用:有利于CPU繁忙型的作业,而不利于I/O繁忙的作业(进程)。
从程序规模上看,一般I/O繁忙型作业CPU进行处理的用时相对比较短,CPU繁忙型的作业相对较长。而FCFS不利于短作业,I/O繁忙型作业一旦排队靠后就会处于劣势。
另一方面,I/O繁忙型作业需频繁的请求I/O,即使排队靠前,但由于I/O请求阻塞,重新排队可能就会排到队尾(这一情况在其他算法下也是普遍的,但不同的算法,排队情况不同,相对的在照顾公平性上也会有所不同)。
目前大多数事务处理都属于I/O繁忙型作业。
2.短作业(进程)优先调度算法SJF/SPF
优点:
通过上表可见采用SJF/SPF算法,平均周转时间、平均带权周转时间都有明显改善。SJF/SPF调度算法能有效的降低作业的平均等待时间,提高系统吞吐量。
SJF/SPF的不足:
1. 对短作业有利,但同时造成了对长作业的不利。
2.由于作业(进程)的长短含主观因素,不一定能真正做到短作业优先。
3.未考虑作业的紧迫程度,因而不能保证紧迫性作业(进程)的及时处理。
方式:
分抢占和非抢占两种方式,上例为简单的非抢占式。
3.高优先权优先调度算法HPFHighest Priority First
照顾紧迫性作业,使其获得优先处理而引入调度算法。常用于批处理系统中的作业调度算法,以及多种操作系统中的进程调度算法
1)分两种方式:
非抢占式优先权算法
抢占式优先权算法 关键点:新作业产生时
2)优先权的类型
静态优先权:创建进程时确定,整个运行期间保持不变。一般利用某一范围的一个整数来表示,又称为优先数。
动态优先权:创建进程时赋予的优先权可随进程的推进或随其等待时间的增加而改变。
3)高响应比优先调度算法HRRNHighest Response Raito Next
短作业优先算法是一种比较好的算法(相当于根据作业长度设定的静态优先权算法),适用于短作业较多的批处理系统中,其主要不足是长作业的运行得不到保证。
HRRN为每个作业引入动态优先权,使作业的优先级随着等待时间的增加而以速率a提高:
优先权 =(等待时间+要求服务时间)/要求服务时间= 响应时间 / 要求服务时间
什么时候计算各进程的响应比优先权?
需要进行调度选择的时候比较各自优先权
作业完成时
新作业产生时(抢占、非抢占)
时间片完成时
进程阻塞时
4.基于时间片的轮转调度算法RR (Round Robin)
分时系统新需求:及时响应用户的请求;采用基于时间片的轮转式进程调度算法
(1)时间片轮转算法
将系统中所有的就绪进程按照FCFS原则,排成一个队列。
每次调度时将CPU分派给队首进程,让其执行一个时间片。时间片的长度从几个ms到几百ms。
在一个时间片结束时,发生时钟中断。
调度程序据此暂停当前进程的执行,将其送到就绪队列的末尾,并通过上下文切换执行当前就绪的队首进程。
关于时间片长度
时间片长度的选择要与完成一个基本的交互过程所需的时间相当,保证一个基本的交互过程可在一个时间片内完成。
设置不合适反而都会导致响应时间长。
过长会怎样?——FCFS
过短会怎样?——频繁切换
争议:若同时有时间片到放弃CPU的A进程、新就绪的进程B,二者在就绪队列中如何排序。
做题时给出统一的假设,
若设新进程就绪比较快,就统一按BA的顺序排入就绪队列。
若设旧进程该为就绪比较快,则统一按AB排序
(2)多级反馈队列算法FB
(Multiple-level Feed Back Queue)
特点:多个就绪队列,循环反馈
动态优先级、时间片轮转
1)设置多个就绪队列,各队列有不同的优先级,优先级从第一个队列依次降低。
2) 赋予各队列进程执行时间片大小不同, 优先权越高,时间片越短。
3)当一个新进程进入内存,引发的调度过程
准备调度:先将它放入第一个队列的末尾,按FCFS原则排队等待调度。
IF时间片内完成,便可准备撤离系统;
IF时间片内未能完成,调度程序便将该进程转入第 二队列的末尾等待再次被调度执行。
当第一队列中的进程都执行完,系统再按FCFS原则调度第二队列。在第二队列的稍放长些的时间片内仍未完成,再依次将它放入第三队列。
依次降到第n队列后,在第n队列中便采取按时间片轮转的方式运行。
注意:
各队列的时间片逐渐增大。优先级逐渐降低
仅当优先权高的队列(如第一队列)空闲时,调度程序才调度第二队列中的进程运行;仅当第1~(i-1)队列均空时,才会调度第i队列中的进程运行。
高优先级抢占问题:
第i队列中为某进程正占有CPU,又有新进程进入优先权较高的队列(第1~i-1队中);
被抢占的进程放回原就绪队列末尾;
多级反馈队列调度算法的性能
多级反馈队列调度算法具有较好的性能,能较好的满足各种类型用户的需要。
终端型作业用户。大多属于较小的交互性作业,只要能使作业在第一队列的时间片内完成,便可令用户满意。
短批处理作业用户。周转时间仍然较短,至多在第二到三队列即可完成。
长批处理作业用户。将依次在1~n级队列中轮转执行,不必担心作业长期得不到处理。
例题1:现有两道作业同时执行,一道以计算为主,另一道以输入输出为主,你将怎样赋予作业进程占有处理器的优先级?为什么?
将以I/O为主的作业赋予较高的优先级。当这种作业先占有处理器执行时,一旦启动外围设备,它就会让出处理机;另一道作业就可占用处理机;使处理机和外围设备都处于忙状态,提高系统的资源利用率。
例题2:有一个可以收容两道作业的批处理系统,作业调度采用短作业优先(SJF)的调度算法,进程调度采用以优先数为基础的抢占式调度算法。有如下表所示的作业序列(表中所列作业优先数即为进程优先数,数值越小优先级越高)。
(1)列出所有作业进入内存时刻及结束时刻;
(2)计算作业的平均周转时间。
分析
作业A先运行20分钟,作业B由于优先级高抢占运行,(此时A中止)由于只允许两道批处理,所以直到B运行完毕后,才能调度下一个作业;
B运行完毕后,按照短作业优先的方式,将D调入内存,由于D的优先级低于A,所以此时A继续运行,D等待;
待A运行完毕之后,将C调入内存,由于C的优先级高,所以C运行,D继续等待,直到C运行完毕后,D才运行,直至结束。
答
例题3:设四个进程A、B、C和D依次进入就绪队列(同时到达),四个进程分别需要运行12、5、3和6个时间单位。
① 图示RR法时间片q=1和q=4时进程运行情况。
② 算出各进程的周转时间和带权周转时间
几种常用调度算法的比较
三、实时调度
什么是实时系统
1.指系统能够在限定的响应时间内提供所需水平的服务。
2.指计算的正确性不仅取决于程序的逻辑正确性,也取决于结果产生的时间,如果系统的时间约束条件得不到满足,将会发生系统出错。
实时任务:具有明确时间约束的计算任务,有软/硬,随机/周期性之分。
1. 实现实时调度的基本条件
1)提供必要的信息
为了实现实时调度,系统应向调度程序提供有关任务的下述信息:
就绪时间。该任务成为就绪状态的时间。
开始截止时间、完成截止时间。
处理时间。从开始执行到完成所需时间。
资源要求。任务执行时所需的一组资源。
优先级。根据任务性质赋予不同优先级。
2)系统处理能力足够强
系统中有M个周期性的硬实时任务,处理时间为Ci,周期时间表示为Pi,
单机系统中必须满足条件
一个系统,6个硬实时任务,周期都是50ms,每次处理时间10ms。根据公式,系统是不可调度的。10*6/50
- 提高系统处理能力的方法
增强单机系统的处理能力
采用多处理机系统
此情况下需满足
∑( Ci / Pi )≤N,N为处理机数
3)采用抢占式调度机制
硬实时任务:广泛采用抢占机制。
小的实时系统:如能预知任务的开始截止时间,为简化调度程序和对任务调度时所花费的系统开销,可采用非抢占调度机制
4)具有快速切换机制
对外部中断的快速响应能力。
利用快速硬件中断机构,可在紧迫的外部事件请求中及时响应。
快速的任务分派能力。
使系统中的运行功能单位适当的小,提高切换速度。类如线程的思想
2. 实时调度算法的分类
-
根据实时任务的性质
硬实时调度算法
软实时调度算法; -
按调度方式
非抢占调度算法
该算法较简单,用于一些小型实时系统或要求不太严格的实时系统中,又可分为:
非抢占式轮转调度算法。常用于工业生产的群控系统中,要求不太严格。
非抢占式优先调度算法。要求相对严格,根据任务的优先级安排等待位置。可用于有一定要求的实时控制系统中。(精心设置可获得百ms级的响应时间)抢占式调度算法
较严格的实时系统中(t约为数十ms),选择采用抢占式优先权调度算法。根据抢占发生时间可分为:
基于时钟:某高优先级任务到达后并不立即抢占,而等下一个时钟中断时抢占。
立即抢占:一旦出现外部中断,只要当前任务未处于临界区,就立即抢占处理机。
抢占调度算法;
- 根据调度时间不同
静态调度算法
动态调度算法。 - 多处理机环境下
集中式调度
分布式调度
3. 常用的几种实时调度算法
目前有许多实时调度算法,在常用的算法中简单介绍两种实时调度算法:
- 最早截止时间优先EDF(Earliest Deadline First)算法
根据任务的开始截止时间来确定任务的优先级。截止时间越早,其优先级越高。
系统保持一个实时任务就绪队列
队列按各任务截止时间的早晚排序
调度程序总是选择就绪队列中的第一个任务,分配处理机使之投入运行。
新任务产生时,是否等当前程序执行完:
抢占式/非抢占式
可能会使作业错过,但可适用于软实时系统
- 最低松弛度优先LLF(Least Laxity First)算法
根据任务紧急(或松弛)的程度,来确定任务的优先级。任务的紧急程度越高(松弛度值越小),优先级就越高。
松弛度= 截止完成时间 – 还需执行时间 - 当前时间
可理解为当前时刻到开始截止时刻间的差距,随着时间的推进,这个差值逐渐变小,任务越来越紧迫。
例如
任务A,截止完成时间=200ms,运行=100ms;
任务B,截止完成时间= 400ms,运行=150ms,
当前t=0时刻,两者的松弛度分别为
A松弛度=200-100ms; B松弛度=250ms。
进程切换发生的时机
进程执行完
进程I/O阻塞
新进程出现时可能的抢占
某进程松弛度为0时发生抢占
有的时刻,其他并发的实时任务下一周期未到来,会出现只有一个任务的情况。
四、产生死锁的原因和必要条件
死锁(Deadlock):指多个进程在运行过程中,因争夺资源而造成的一种僵局。当进程处于这种状态时,若无外力作用,它们都将无法再向前推进。
饥饿(Starvation):指一个进程无休止地等待!
产生死锁的原因可归结为如下两点:
1.竞争资源 系统中供多个进程共享的资源如打印机、公用队列等的数目不满足需要时,会引起资源竞争而产生死锁。
可把系统中的资源分为两类:
可剥夺和非剥夺性资源
可剥夺性资源:分配给进程后可以被高优先级的进程剥夺。如CPU和主存。
不可剥夺性资源:分配给进程后只能在进程用完后释放。如磁带机、打印机等。
永久性资源和临时性资源
永久性:打印机。可顺序重复使用
临时性:进程产生被其他进程短暂使用的资源,如数据资源:“生产者/消费者”算法中的信号量。。它可能引起死锁。
2.进程间推进顺序非法 进程在运行过程中,请求和释放资源的顺序不当,同样会导致死锁。
进程在运行中具有异步性特征,多个进程按向前推进的顺序有两种情况:
推进顺序合法
推进顺序非法
3.产生死锁的必要条件
形成死锁的四个必要条件(四个条件都具备就会死锁,缺一就不会死锁)
互斥条件:进程对所分配到的资源进行排他性使用
请求和保持条件:进程已经保持了至少一个资源,又提出新的资源请求,而新请求资源被其他进程占有只能造成自身进程阻塞,但对自己已获得的其他资源保持不放,必然影响其他进程。
不剥夺条件:进程已获得的资源未使用完之前不能被剥夺,只能在使用完时由自己释放。
环路等待条件
4、处理死锁的基本方法
事先预防:
- 预防死锁
设置限制条件,破坏四个必要条件的一个或几个,预防发生死锁。
较易实现。限制条件的严格也会导致系统资源利用率和系统吞吐量降低。 - 避免死锁
不须事先限制,破坏四个必要条件,而是在资源的动态分配过程中,用某种方法去防止系统进入不安全状态,从而避免发生死锁。
这种事先加以较弱限制的方法,实现上有一定难度,但可获较高的资源利用率及系统吞吐量,目前在较完善的系统中,常用此方法来避免发生死锁。
事后处理:
- 检测死锁。
允许系统运行过程中发生死锁,但通过系统检测机构可及时的检测出,能精确确定与死锁有关的进程和资源;然后采取适当的措施,从系统中将已发生的死锁清除掉。 - 解除死锁。
与死锁检测配套的一种措施。
常用的实施方法:撤销或挂起一些进程,以便回收一些资源并将他们分配给已阻塞进程,使之转为就绪以继续运行。
死锁的检测与解除措施,有可能使系统获得较好的资源利用率和吞吐量(死锁几率不一定很高),但在实现上难度也最大。
五、预防死锁的方法
1.预防死锁
资源的排他性无法更改,故在其他3个条件上入手
摒弃“请求和保持”条件:所有进程开始运行前,必须一次性的申请其在整个运行过程所需的全部资源(AND)。算法简单、易于实现且很安全。但缺点是资源浪费严重、或进程延迟运行。
摒弃“不剥夺”条件:允许进程先运行,但当提出的新要求不被满足时必须释放它已保持的所有资源,待以后需要时再重新申请。实现比较复杂且付出很大代价。可能会造成前功尽弃,反复申请和释放等情况。
摒弃“环路等待”条件
有序设置资源:将所有资源按类型进行线性排队,赋予不同序号。所有进程对资源的请求必须严格按照资源序号递增的次序提出,这样在所形成的资源分配图中,不可能会出现环路。
与前两种策略比较,资源利用率和系统吞吐量都有较明显的改善。但也存在严重问题:
资源编号限制新设备的增加;
应用中的使用设备顺序与规定的顺序并不协调;
限制了用户编程自由。
例:设有一个T型路口,其中A、B、C、D处各可容纳一辆车,车行方向如下图所示,试找出死锁并用有序资源分配法消除之。要求资源编号合理。
答:
可能的死锁状态(4个位置都填满):(1)E方向两辆车分别位于A和B;S方向一辆车位于C;W方向一辆车位于D。(2)S方向两辆车分别位于B和C;E方向一辆车位于A;W方向一辆车位于D。
预防死锁的处理(对资源请求按单向顺序)
为位置资源C、B、A、D设置四个信号量s1,s2,s3,s4,信号量的初值均为1
对他们的使用规定按顺序从低到高编号为1、2、3、4
使用四个位置的信号量必须按规定顺序申请资源,车辆活动代码如下:
2.避免死锁
采用避免死锁的方法则是只施加较弱限制条件,从而获得令人满意的系统性能。
安全状态:系统能按某种进程顺序为每个进程分配所需资源,直至满足每个进程对资源的最大需求,并能顺利完成。
不安全状态:系统无法找到一种使多个进程能够顺利分配资源执行完的安全序列。
只要使系统始终处于安全状态,便可避免发生死锁。
不是所有的不安全状态都是死锁状态。
3. 银行家算法避免死锁
最有代表性的避免死锁的算法,是Dijkstra的银行家算法。由于该算法能用于银行系统现金贷款的发放而得名。
【思路描述】:随时对系统中的所有资源信息进行统计,包括每种资源的数量、已分配给各进程的数量;每当进程提出某种资源请求时判断该请求分配后是否安全,如果安全才分配。对每个资源请求的处理都要保证系统始终从一个安全状态到另一个安全状态。
1)银行家算法中的数据结构
(1)各类可利用资源的数量
向量Available :(i1,i2,…,im),含m个元素,每个元素代表一类可利用的资源数目。
动态变化的,初始值是系统配置的该类资源的全部数目,值随资源的分配与回收而动态的改变。
实现:一维数组。Available【j】=K,表示系统中Rj类资源现有可用数量为K个。
(2)每个进程对每类资源的需求
最大需求、已获得的、还需要的
最大需求矩阵Max
nm,系统中n个进程中每个进程分别对m类资源的最大需求。
取值:根据进程需求赋初始值。
实现:二维数组。Max【i,j】=K,表示进程 i 需要Rj类资源的最大数目为K。
已分配矩阵Allocation
nm,定义系统中每一进程已获得的每类资源数量。
Allocation【i,j】=K,表示进程i当前已分得Rj类资源数为K。
还需求的矩阵Need。
n*m,表示每一进程尚需的各类资源数。
Need【i,j】=K,表示进程i还需要Rj类资源K个,方能完成任务。
上述三个矩阵存在关系:
Max【i,j】= Allocation【i,j】+Need【i,j】
每次,给进程 i 分配资源的动作,影响上述数据结构的取值:
Available【 】,Allocation【i,】,Need【i,】
2)避免死锁的算法过程(银行家算法)
当前资源分配状态如何?构建资源分配表
判断向下运行过程中,各进程对资源的需求是否安全。
在当前资源分配状态基础上,分析进程的实际请求Requesti【j】= k。表示进程Pi需要K个Rj类型的资源。
算法过程:就是对各进程的Request向量及资源数量进行一系列判断及值操作。
进程Pi发出资源请求后,系统按下述步骤进行检查:
首先是两个基本判断:
3)安全性算法
(1)需要一些记录信息的数据结构,设置两个向量:
工作向量work
算法开始时work=Available;
系统找安全序列的过程需要不断判断和修改当前资源数量,不能直接修改原始数据记录Aailable。
标志向量Finish
表示每个进程是否有足够的资源使之运行完成。开始时所以进程都设置初值Finish[i]:=false;
找安全序列的过程相当于使所有Finish[i]:=true。
(2)找安全序列的过程
a) 假设Pi获得资源顺利执行完,释放出分配给它的资源,修改相应的值:
work【j】 = work【i】+ Allocation【i,j】;
Finish【i】= true;
goto step (2); //返回去继续找下一个进程。
b)当算法不再在(2)、a)步间循环找进程,到达本步时,若所有Finish[i]=true都满足,则表示所有进程都按某个顺序执行完了,系统处于安全状态;否则,系统当前所处的资源分配状态是不安全状态。
六、死锁的检测与解除
1、资源分配图
系统死锁可利用资源分配图来描述。
圆圈表示进程
方框表示一类资源,其中的一个点代表一个该类资源
请求边由进程指向方框中的资源
分配边则由方框中的一个点即资源。
死锁的检测时机
-
当进程等待时检测死锁
-
定时检测
-
系统资源利用率下降时检测死锁
死锁检测算法
- 每个进程和资源指定唯一编号
- 设置一张资源分配表
记录各进程与其占用资源之间的关系 - 设置一张进程等待表
记录各进程与要申请资源之间的关系
2、死锁定理
利用资源分配图简化法来检测死锁。
简化方法如下:
1.在资源分配图中找出一个既不阻塞又非独立的进程结点Pi,在顺利的情况下运行完毕,释放其占有的全部资源。
2.由于释放了资源,这样能使其它被阻塞的进程获得资源继续运行。消去了Pi的边。
3.经过一系列简化后,若能消去图中所有边,使结点都孤立,称该图是可完全简化的。
S状态为死锁状态的充分条件是当且仅当S状态的资源分配图是不可完全简化的。<死锁定理>
3、 死锁的解除
当发现进程死锁时,便应立即把它们从死锁状态中解脱出来。常采用的方法是:
剥夺资源 从其他进程剥夺足够数量的资源给死锁进程以解除死锁状态。
撤销进程 最简单的是让全部进程都死掉;温和一点的是按照某种顺序逐个撤销进程,直至有足够的资源可用,使死锁状态消除为止。