操作系统学习笔记 之 作业/进程调度基础知识

进程调度的时机、切换、过程和方式

我们都知道处理机调度分为三种,其中进程调度就是我们需要重点掌握的内容

时机
什么时候需要进程调度

进程调度分两种情况,一种是当前运行的进程主动放弃处理机,另一种就是当前运行的进程被动放弃处理机(搁这搁这)。

主动放弃可以分为下面几种情况:

  • 进程正常终止

  • 运行过程中发生异常而终止

  • 进程主动请求阻塞(如等待I/0)

被动放弃可以有如下情形:

  • 分给进程的时间片用完
  • 有更紧急的事需要处理(如I/0中断)
  • 有更高优先级的进程进入就绪队列
什么时候不能进行进程调度

当然,也有不能进行进程调度的情形:

  • 处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换
  • 进程在操作系统内核程序临界区
  • 原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)

这里补充一下知识点:临界区和临界资源。

  • 临界资源是指一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。

  • 临界区就是指一个进程中访问临界资源的那段代码(注意是代码嗷!)。

内核程序临界区一般就是有用来访问某种内核数据结构的,比如进程的就绪队列(由各进程的PCB组成)。

需要注意的是:进程在操作系统内核程序临界区中不能进行调度与切换是对的,但是进程处于临界区时不能进行处理机调度则是错的。

下面来两个案例进行解释:

假设一个进程存在内核程序临界区,当它通过临界区访问就绪队列的时候,会给队列上锁。假如说在进程还没退出临界区(还没解锁)时候,对该进程实施进程调度,又因为进程调度相关的程序也要访问就绪队列,那这个时候就产生矛盾了,进程调度程序会因为就绪队列被锁(无法对就绪队列操作)而无法顺利完成进程调度。

再假设,一个进程正在访问打印机。打印机也是一种临界资源,在其完成打印之前,进程会一直处于临界区内,但是打印机又是慢速设备,此时如果一直不允许操作系统进行进程调度,就会导致处理机在打印机完成打印之前一直处于空闲状态。

而普通临界区访问的临界区资源不会直接影响操作系统内核的管理工作,因此在访问普通临界区时可以进行调度与切换

方式

了解完进程调度发生的时机,我们再了解了解进程调度的方式。进程调度的方式主要分成两中:非剥夺调度方式和剥夺调度方式。

非剥夺调度方式(非抢占式)

非剥夺调度方式,又称非抢占方式。即只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。

可以看到的是,这种调度方式实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统

剥夺调度方式(抢占式)

剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。

这种处理方式可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能( 通过时钟中断)。适合于分时操作系统、实时操作系统

切换与过程
"狭义的调度"与“切换"的区别

狭义的进程调度进程切换的区别:

  • 狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)

  • 进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。

广义的进程调度包含了选择进程和进程切换两个步骤。

有时候并不特指广义或狭义,根据题目信息判断即可

进程切换的过程需要做什么?

进程切换的过程主要完成了:

  • 对原来运行进程各种数据的保存
  • 对新的进程各种数据的恢复(也就是将程序计数器、程序状态字、各种数据等处理机现场信息放到寄存器当中,这些信息一般保存在进程控制块)

注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。

所以并不是进程调度越频繁,系统并发度越高

小结

在这里插入图片描述

调度算法的评价指标

这一小节主要理解一些关于评价指标的名词,以及相关计算方法。

CPU利用率

由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作

CPU利用率就是指CPU“忙碌”的时间占总时间的比例。

计算方式如下:

利 用 率 利用率 ​​ = = = 忙 碌 的 时 间 总 时 间 \frac {忙碌的时间} {总时间}

当然,有些题目不会只算CPU利用率

例如: 某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒,再用打印机打印输出5秒,之后再执行5秒,才能结束。在此过程中,CPU利用率、打印机利用率分别是多少?

答: C P U 利 用 率 CPU利用率 CPU = = = 5 + 5 5 + 5 + 5 \frac {5 + 5} {5 + 5 + 5} 5+5+55+5 = = = 66.6 66.6 66.6%​​, 打 印 机 利 用 率 打印机利用率 = = = 5 5 + 5 + 5 \frac {5} {5 + 5 + 5} 5+5+55 = = = 33.3 33.3 33.3​%​​​

系统吞吐量

系统吞吐量是指单位时间内完成作业的数量

系 统 吞 吐 量 系统吞吐量 = = = 总 共 完 成 了 多 少 道 作 业 总 共 花 了 多 少 时 间 \frac {总共完成了多少道作业} {总共花了多少时间}

比如:某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
答: 系 统 吞 吐 量 系统吞吐量 = = = 10 100 \frac {10} {100} 10010 = = = 0.1 道 / 秒 0.1道/秒 0.1/

周转时间

对于计算机的用户来说,他肯定很关心自己的作业从提交到完成花了多少时间

周转时间、平均周转时间

周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔

它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待I/O操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次

计算方式如下:

( 作 业 ) 周 转 时 间 = (作业)周转时间= ()= = = = 作 业 完 成 时 间 作业完成时间 − - 作 业 提 交 时 间 作业提交时间

平 均 周 转 时 间 = 平均周转时间= = = = = 各 作 业 周 转 时 间 之 和 作 业 数 \frac {各作业周转时间之和} {作业数}

周转时间=

为了避免麻烦,我们当然是不会仔细算每一部分的时间的

带权周转时间、平均带权周转时间

对于用户来说,那肯定不更关心自己的单个作业的周转时间,对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值。

有的作业运行时间短,有的作业运行时间长,因此在周转时间相同的情况下,运行时间不同的作业,给用户的感觉肯定是不一样的。

由此提出了带权周转时间这一个概念。

带 权 周 转 时 间 带权周转时间 = = = 作 业 周 转 时 间 作 业 实 际 运 行 的 时 间 \frac {作业周转时间} {作业实际运行的时间} = = = 作 业 完 成 时 间 − 作 业 提 交 时 间 作 业 实 际 运 行 的 时 间 \frac {作业完成时间 - 作业提交时间} {作业实际运行的时间}

平 均 带 权 周 转 时 间 平均带权周转时间 = = = 各 作 业 带 权 周 转 时 间 之 和 作 业 数 \frac {各作业带权周转时间之和} {作业数} ​​

可以看到的是:带权周转时间必然>1,带权周转时间与周转时间都是越小越好。

从用户角度来说:

  • 对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时间更多,带权周转时间更小,用户满意度更高。
  • 对于实际运行时间相同的两个作业,周转时间短的带权周转时间更小,用户满意度更高。
等待时间

计算机的用户希望自己的作业尽可能少的等待处理机

等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。

对于进程来说,等待时间就是指进程建立后等待被服务的时间之和

在等待I/0完成的期间其实进程也是在被服务的,所以不计入等待时间

对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间

一个作业总共需要被CPU服务多久,被I/O设备服务多久,一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。

响应时间

对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
响应时间,就是指从用户提交请求到首次产生响应所用的时间。

小结

在这里插入图片描述

传统调度算法(批处理系统)

前面说了很多关于调度的基本知识,这里开始了解操作系统关于调度的算法。

先来先服务(FCFS)

先来先服务(FCFS,First Come First Serve)主要知识点如下:

类别内容
算法思想主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子)
算法规则按照作业/进程到达的先后顺序进行服务
用于作业/进程调度用于作业调度时,考虑的是哪个作业先到达后备队列
用于进程调度时,考虑的是哪个进程先到达就绪队列
是否可抢占非抢占式的算法
优缺点优点:公平、算法实现简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利
是否会导致饥饿不会

下面通过一个例题来了解FCFS。

假如各进程到达就绪队列的时间、需要的运行时间如下表所示。使用先来先服务调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

在这里插入图片描述

按照FCFS的规则,我们可以得到如下调度过程:

在这里插入图片描述

答案如下图所示:

在这里插入图片描述

在这里插入图片描述

如果题目中提到有I/O操作,那么等待时间就是周转时间-运行时间-I/O操作时间

短作业优先(SJF)

短作业优先算法主要知识点如下:

类别内容
算法思想追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间
算法规则最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)
用于作业/进程调度即可用于作业调度,也可用于进程调度。用于进程调度时也称为短进程优先(SPF, Shortest Process First)算法
是否可抢占SJF和SPF是非抢占式的算法。但是也有抢占式的版本–最短剩余时间优先算法(SRTN,Shortest Remaining Time Next)
优缺点优点:“最短的”平均等待时间、平均周转时间
缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
是否会导致饥饿会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死”

例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用非抢占式短作业优先调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

在这里插入图片描述
按照SPF的算法法则,有如下调度顺序:

在这里插入图片描述

答案如下:

在这里插入图片描述

可以发现的是,SPF的平均周转时间、平均带权周转时间、平均等待时间一般要比FCFS少

这里再了解一下最短剩余时间优先算法。

最短剩余时间优先算法(SRTN):每当有进程加入就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度

在问到这种算法的题目中,要注意需要不断分析进程的执行顺序

拿上面那道题目作为案例,分析过程如下:

在这里插入图片描述

执行过程如下:

在这里插入图片描述

答案如下:

在这里插入图片描述

可以得到的结论是:这个抢占式的算法比之前非抢占式的算法具有更优的整体效果

注意:

  • 如果题目中未特别说明,所提到的“短作业/进程优先算法”默认是非抢占式
  • 很多书上都会说”SJF调度算法的平均等待时间、平均周转时间最少“,严格来说,这个表述是错误的,不严谨的。之前的例子表明,最短剩余时间优先算法得到的平均等待时间、平均周转时间还要更少。应该加上一个条件“在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最少”;或者说“在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少”;
    如果不加上述前提条件,则应该说“抢占式的短作业/进程优先调度算法(最短剩余时间优先,SRNT算法)的平均等待时间、平均周转时间最少
  • 虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但相比于其他算法(如FCFS),SJF依然可以获得较少的平均等待时间、平均周转时间。
  • 如果选择题中遇到“SJF算法的平均等待时间、平均周转时间最少”的选项,那最好判断其他选项是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项
高响应比优先(HRRN)

根据前面的学习,可以发现的是:FCFS算法是在每次调度的时候选择一个等待时间最长的作业(进程)为其服务。但是没有考虑到作业的运行时间,因此导致了对短作业不友好的问题;SJF算法是选择一个执行时间最短的作业为其服务。但是又完全不考虑各个作业的等待时间,因此导致了对长作业不友好的问题,甚至还会造成饥饿问题。

那我们能不能设计一个算法,即考虑到各个作业的等待时间,也能兼顾运行时间呢?那当然是可以的。

下面是高相应比算法的基本知识点:

类别内容
算法思想要综合考虑作业/进程的等待时间和要求服务的时间
算法规则在每次调度时先计算各个就绪作业/进程的响应比,选择响应比最高的作业/进程为其服务
计算公式: 响 应 比 响应比 ​​ = = =​​ 等 待 时 间 + 要 求 服 务 时 间 要 求 服 务 时 间 \frac {等待时间+要求服务时间} {要求服务时间} +
用于作业/进程调度即可用于作业调度,也可用于进程调度
是否可抢占非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时(正常/异常完成、阻塞),才需要调度,才需要计算响应比
优缺点综合考虑了等待时间和运行时间(要求服务时间)
等待时间相同时,要求服务时间短的优先(SJF 的优点)
要求服务时间相同时,等待时间长的优先(FCFS 的优点)
对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
是否会导致饥饿不会

还是以上面那道题作为例题。按照HRRN算法,有如下分析:

在这里插入图片描述

算法执行过程图示如下:

在这里插入图片描述

小结

注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法将在下面学到。

新式调度算法(交互式系统)

时间片轮转调度算法(RR)

时间片轮转算法主要知识点如下:

类别内容
算法思想公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
算法规则按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。
用于作业/进程调度用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)
是否可抢占若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法,由时钟装置发出时钟中断来通知CPU时间片已到
优缺点优点:公平、响应快、适用于分时操作系统
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
是否会导致饥饿不会

可以看到的是,时间片轮转调度算法更适用于分时操作系统,更注重“响应时间”,而不是”周转时间“。

老样子,拿之前的题目做例子。

按照RR算法,假设时间片大小为2,那么我们可以得到下面的进程调度分析过程:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

调度过程图示如下:

在这里插入图片描述

那把时间片做一下调整,比如说5,结果会怎么样呢?

调度分析过程:

在这里插入图片描述

调度图示:

在这里插入图片描述

可以发现的是,如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。

另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小。

一般来说,设计时间片时要让切换进程的开销占比不超过1%

优先级调度算法

优先级调度算法主要知识点总结如下:

类别内容
算法思想随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
算法规则每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程
用于作业/进程调度既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/O调度中
是否可抢占抢占式、非抢占式都有(做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占)
优缺点优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度
缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
是否会导致饥饿

这里需要说明一点:优先数和优先级的关系,并不是说优先数越大优先级越高,也有可能是前者越小优先级越高,具体需要注意题目所给信息

假如有如下题目:

各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用非抢占式的优先级调度算法,分析进程运行情况。(注: 优先数越大,优先级越高)

在这里插入图片描述

按照题目所给”非抢占式“、”优先数大优先级高“,我们有如下分析过程:

在这里插入图片描述

有如下调度图示:

在这里插入图片描述

那如果是”抢占式“的呢?

这时我们需要同时思考作业到达时和作业(完成)主动放弃时两种情况。可得如下分析过程:

在这里插入图片描述

可得如下图示:

在这里插入图片描述

补充几个小知识点:

  • 就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置
  • 根据优先级是否可以动态改变,可将优先级分为静态优先级动态优先级两种
    • 静态优先级:创建进程时确定,之后一直不变。
    • 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。

那么如何合理地设置各类进程的优先级呢?

我们有如下一般性规则:

  • 系统进程优先级高于用户进程
  • 前台进程优先级高于后台进程
  • 系统调度时更偏好I/O型进程(或称I/O繁忙型进程),而不是计算型进程(CPU繁忙型进程)

关于第三点,主要原因是:

I/O设备和CPU可以并行工作,如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升

多级反馈队列调度算法

保留节目来了。

结合前面所学的知识,我们可以知道:FCFS算法的优点是公平;SJF算法的优点是能尽快处理完短作业,平均等待/周转时间等参数很优秀;时间片轮转调度算法可以让各个进程得到及时的响应;优先级调度算法可以灵活地调整各种进程被服务的机会。

能否对其他算法做个折中权衡?得到一个综合表现优秀平衡的算法呢?

那当然是可以的:多级反馈调度算法。

UNIX使用的就是这种算法

下面是多级反馈队列调度算法的知识点总结:

类别内容
算法思想对其他调度算法的折中权衡
算法规则1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾
3. 只有第k级队列为时,才会为k+1级队头进程分配时间片
用于作业/进程调度用于进程调度
是否可抢占抢占式的算法。在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。
优缺点对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O阻塞后激活的进程重新放回原队列,这样I/O型进程就可以保持较高优先级)
是否会导致饥饿会(多个短进程源源不断地到来时,会被分配给较高优先级的队列,而较低优先级队列的长进程可能会因此导致饥饿)

这个算法整体规则要比前几种复杂得多,下面我们来个案例来进行具体理解。

假设各进程到达就绪队列的时间、需要的运行时间如下表所示。使用多级反馈队列调度算法,分析进程运行的过程。

在这里插入图片描述

队列分级和时间片分配规则假设如下:

在这里插入图片描述

根据算法规则,我们知道各个进程在队列中的调度走向是这样的:

在这里插入图片描述

所以,我们有如下调度执行情况分析:

在这里插入图片描述

  • 6
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值