第二章进程与线程
2.1进程与线程
2.1.1进程的概念,组成,特征
1,进程的概念
程序:是静态的,就是个存放在磁盘里的可执行文件,如:QQ.exe。
进程:是动态的,是程序的一次执行过程,如:可同时启动多次QQ程序。
同一个程序多次执行会对应多个进程
2,进程的组成
一个进程实体(进程映像)由PCB、程序段、数据段组成。
PCB是给操作系统用的。
程序段、数据段是给进程自己用的。
进程是动态的,进程实体(进程映像)是静态的。
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
所以这里更确切的说是进程实体的组成。
1,PCB进程控制块
操作系统需要对各个并发运行的进程进行管理,但凡操作系统对进程管理时所需要的信息,都会被放在PCB中,是给操作系统用的
- 进程描述信息
进程标识符PID
当进程被创建时,操作系统会为该进程分配一个唯一的, 不重复的“身份证号”–PID (Process ID,进程D)
用户标识符UID
- 进程控制和管理信息
CPU、磁盘、网络流量使用情况统计.…
进程当前状态:就绪态/阻塞态/运行态…
- 资源分配清单
正在使用哪些文件
正在使用哪些内存区域
正在使用哪些I/O设备
- 处理机相关信息
如PSW、PC等等各种寄存器的值(用于实现进程切换)
2,程序段
程序的代码(指令序列)
3,数据段
运行过程中产生的各种数据(如:程序中定义的变量)
3,进程的特征
1,动态性
进程是程序的一次执行过程,是动态产生、变化和消亡的,是进程的最基本特征
2,并发性
内存中有多个进程实体,各进程可并发执行
3,独立性
进程是能独立运行,独立获得资源,独立接受调度的基本单位
4,异步性
各进程按各自独立的,不可预知的速度向前推进,操作系统要提供进程同步机制来解决异步问题
5,结构性
每个进程都会配置一个PCB,结构上看,进程由程序段,数据段,PCB组成
2.1.2进程的状态与转换
1,进程的状态
1,创建状态
进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化PCB
2,就绪状态
当进程创建完成后,便进入“就绪态”,处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,就暂时不能运行
3,运行状态
如果一个进程此时在CPU上运行,那么这个进程处于“运行态
CPU会执行该进程对应的程序(执行指令序列)
4,阻塞态
在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的应)。
在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入“阻塞态”
5,终止状态
一个进程可以执行exit系统调用,请求操作系统终止该进程。
此时该进程会进入“终止态”,操作系统会让该进程下CPU,并回收内存空间等资源,最后还要回收该进程的PCB。
当终止进程的工作完成之后,这个进程就彻底消失了。
TIPS
不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求)
2,进程间的状态转换
单CPU情况下,同一时刻只会有一个进程处于运行态,多核CPU情况下,可能有多个进程处于运行态
1,就绪态转运行态
进程被调度
2,运行态转就绪态
进程的时间片被用完或者CPU被其它高优先级的进程抢占
3,运行态转阻塞态
等待系统资源分配或者等待某事件的发生(进程的主动行为)
4,阻塞态转就绪态
等待的资源分配到位或者等待的事件发生了(进程的被动行为)
5,创建态转就绪态
系统完成创建进程相关的工作
6,运行态转终止态
进程运行结束或者运行过程中遇到不可修复的错误
3,进程的组织方式
- 链式方式
按照进程状态将PCB分为多个队列
操作系统持有指向各个队列的指针
- 索引方式
根据进程状态的不同,建立几张索引表
操作系统持有指向各个索引表的指针
2.1.3进程控制
1,基本概念
1,什么是进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现
进程状转换等功能。进程控制就是要实现进程状态的转换
2,如何实现进程控制
进程控制用原语实现,是一种特殊的程序,它的执行具有原子性。也就是说,进程控制这段程序的运行必须一气呵成,不可中断
2,相关原语
原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。
可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性
1,进程的创建
操作系统创建一个进程时使用的原语
- 创建原语
申请空白PCB
为新进程分配所需资源
初始化PCB
将PCB插入就绪队列(创建态—>就绪态)
- 引起进程创建的事件
用户登录:分时系统中,用户登录成功,系统会建立为其建立一个新的进程
作业(程序)调度:多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程
提供服务:用户向操作系统提出某些请求时,会新建一个进程处理该请求
应用请求:由用户进程主动请求创建一个子进程
2,进程的终止
就绪态/阻素态/运行态→终止态→无
- 撤销原语
从PCB集合中找到终止进程的PCB
若进程正在运行,立即剥夺CPU,将CPU分配给其他进程
终止其所有子进程(进程间的关系是树形结构)
将该进程拥有的所有资源归还给父进程或操作系统
删除PCB
- 引起进程终止的事件
正常结束:进程自己请求终止(exit系统调用)
异常结束:整数除以0、非法使用特权指令等,然后被操作系统强行杀掉
外界干预:Ctrl+Alt+delete,用户选择杀掉进程
3,进程的阻塞
阻塞原语唤醒原语必须成对使用
- 阻塞原语(运行态→阻塞态)
找到要阻塞的进程对应的PCB
保护进程运行现场,将PCB状态信息设置为“阻塞态”,暂时停止进程运行
将PCB插入相应事件的等待队列
- 引起阻塞的事件
需要等待系统分配某种资源
需要等待相互合作的其他进程完成工作
4,进程的唤醒
阻塞原语唤醒原语必须成对使用
- 唤醒原语(阻塞态→就绪态)
在事件等待队列中找到PCB
将PCB从等待队列移除,设置进程为就绪态
将PCB插入就绪队列,等待被调度
- 引起进程唤醒事件
等待的事件发生。因何事阻塞,就应由何事唤醒
5,进程的切换
- 切换原语(运行态→就绪态,就绪态→就绪态)
将运行环境信息(进程上下文)存入PCB
PCB移入相应队列
选择另一个进程执行,并更新其PCB
根据PCB恢复新进程所需的运行环境
- 引起进程切换的事件
当前进程时间片到
有更高优先级的进程到达
当前进程主动阻塞
当前进程终止
2.1.4进程间通信
进程间通信(Inter-Process Communication,IPC)是指两个进程之间产生数据交互。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。
1,共享存储
设置一个共享内存区域,并映射到进程的虚拟地址空间
要互斥地访间共享空间(由通信进程自己负责实现互斥)
为避免出错,各个进程对共享空间的访问应该是互斥的。
各个进程可使用操作系统内核提供的同步互斥工具(如P、V操作)
- 基于数据结构的共享(低级)
比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式
- 基于存储区的共享(高级)
操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。
2,消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
- 直接通信方式
消息发送进程要指明接收进程的ID,消息直接挂到接收进程的消息队列里
- 间接通信方式
消息先发到中间体(信箱),通过“信箱”间接地通信。因此又称“信箱通信方式”
3,管道通信
“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区,具有先进先出的特性是数据流的形式。
1.管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
2.各进程要互斥地访问管道(由操作系统实现)
3.当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程。
4.当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程。
5.管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案:
①一个管道允许多个写进程,一个读进程(2014年408真题高教社官方答案);
②允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据(Linux的方案)。
2.1.5 线程的概念
1,什么是线程。为什么要引入线程
有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。“
引入线程后,线程成为了程序执行流的最小单位。
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
线程则作为处理机的分配单元。
2,引入线程机制后,有什么变化
1,资源分配、调度
传统进程机制中,进程是资源分配、调度的基本单位
引入线程后,进程是资源分配的基本单位,线程是调度的基本单位
2,并发性
传统进程机制中,只能进程间并发
引入线程后,各线程间也能并发,提升了并发度
3,系统开销
传统的进程间并发,需要切换进程的运行环境,系统开销很大
线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小
引入线程后,并发所带来的系统开销减小
3,线程的属性
线程是处理机调度的单位
多CPU计算机中,各个线程可占用不同的CPU
每个线程都有一个线程ID、线程控制块(TCB)
线程也有就绪、阻塞、运行三种基本状态
线程几乎不拥有系统资源
同一进程的不同线程间共享进程的资源
由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
同一进程中的线程切换,不会引起进程切换
不同进程中的线程切换,会引起进程切换
切换同进程内的线程,系统开销很小
切换进程,系统开销较大
2.1.6线程的实现方式和多线程模型
1,实现方式
- 用户级线程
从用户视角能看到的线程,由线程库实现
1.用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
2.用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
3.在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程”
4.优缺点
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
- 内核级线程
从操作系统视角看到的线程,由操作系统实现
内核级线程才是处理机分配的单位
1.内核级线程的管理工作由操作系统内核完成。
2.线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
3.操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”
4.优缺点
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
- 组合方式
用户级线程和内核级线程的结合,由此引入了下面几种多线程模型
2,多线程模型
- 一对一模型
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
- 多对一模型
多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
重点:
操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
- 多对多模型
多对多模型:线程(n>=m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。
可以这么理解:
用户级线程是“代码逻辑”的载体,内核级线程是“运行机会”的载体
内核级线程才是处理机分配的单位。
2.1.7线程的状态与转换(与进程类似)
1,状态与转换
就绪态,运行态,阻塞态
2,组织与控制
线程控制块(TCB)
线程表(J将多个TCB组织起来)
2.2处理机调度
2.2.1调度的概念,层次
1,基本概念
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题。
2,三个层次
1,高级调度(作业调度)
按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。
2,中级调度(内存调度)
中级调度(内存调度)——按照某种策略决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。
暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列
3,低级调度(进程调度)
按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。
进程调度的频率很高,一几十毫秒一次。
3,三层调度的联系、对比
要做什么 | 调度发生在 | 发生频率 | 对进程状态的影响 | |
---|---|---|---|---|
高级调度(作业调度) | 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 | 外存→内存(是面向作业的) | 最低 | 无→创建态→就绪态 |
中级调度(内存调度) | 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 | 外存→内存(是面向进程的) | 中等 | 挂起态→就绪态(阻塞挂起→阻塞态) |
低级调度(进程调度) | 按照某种规则,从就绪队列中选择一个进程为其分配处理机 | 内存→CPU | 最高 | 就绪态→运行态 |
4,进程的七状态模型
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
注意“挂起”和“阻塞”的区别,两种状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中。有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列。
2.2.2进程调度的时机、切换与过程、方式
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
1,时机
1,什么时候需要进程调度
- 当前运行的进程主动放弃处理机
进程正常终止
运行过程中发生异常而终止
进程主动请求阻塞(如等待I/O)
- 当前运行的进程被动放弃处理机
分给进程的时间片用完
有更紧急的事需要处理(如l/0中断)
有更高优先级的进程进入就绪队列
2,什么时候不能进行进程调度
1.在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
2.进程在操作系统内核程序临界区中。
3.在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)
2,切换与过程
1,调度切换的区别
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个讲程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
2,切换过程
进程切换的过程主要完成了:
1.对原来运行进程各种数据的保存
2.对新的进程各种数据的恢复(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
3,结论
进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
3,方式
1,非剥夺调度方式(非抢占式)
只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。
实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统
2,剥夺调度方式(抢占式)
当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。
可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统
2.2.3调度器和闲逛进程
1,调度器(调度程序)
管理进程状态切换的程序
·非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作
·抢占式调度策略,每个时钟中断或k个时钟中断会触发调度程序工作
支持内核级线程的操作系统,调度程序的处理对象是内核线程
不支持内核级线程的操作系统,调度程序的处理对象是进程
2,闲逛进程
调度程序永远的备胎,没有其他就绪进程时,运行闲逛进程(idle)
闲逛进程的特性:
·优先级最低
·可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断)
·能耗低
2.2.4调度算法的评价指标
1,CPU利用率
CPU利用率:指CPU“忙碌”的时间占总时间的比例。
利用率=忙碌的时间/总时间
2,系统吞吐量
单位时间内完成作业的数量
系统吞吐量=(总共完成了多少道作业)/(总共花了多少时间)
3,周转时间
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:
作业在外存后备队列上等待作业调度(高级调度)的时间、
进程在就绪队列上等待进程调度(低级调度)的时间、
进程在CPU上执行的时间、
进程等待1/0操作完成的时间。
后三项在一个作业的整个处理过程中,可能发生多次。
(作业)周转时间=作业完成时间-作业提交时间
平均周转时间=(作业周转时间之和)/(作业数)
带权周转时间=(作业周转时间/(作业实际运行的时间)
=(作业完成时间-作业提交时间)/(作业实际运行的时间)
平均带权周转时间=(各作业带权周转时间之和)/(作业数)
4,等等时间
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/0完成的期间其实进程也是在被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。
5,响应时间
对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
响应时间,指从用户提交请求到首次产生响应所用的时间。
2.2.5调度算法(1)
注:下面这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色
1,先来先服务(FCFS,FirstCome First Serve)
1,算法思想
主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子)
2,算法规则
按照作业/进程到达的先后顺序进行服务
3,用于作业/进程调度
用于作业调度时,考虑的是哪个作业先到达后备队列;
用于进程调度时,考虑的是哪个进程先到达就绪队列
4,是否可抢占
非抢占式的算法
5,优缺点
优点:公平、算法实现简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。
即,FCFS算法对长作业有利,对短作业不利(Eg:排队买奶茶…)
6,是否会导致饥饿(某进程/作业长期得不到服务)
不会
2,短作业优先(SJF,ShortestJob First)
1,算法思想
追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间
2,算法规则
最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)
3,用于作业/进程调度
即可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPE,Shortest Process First)算法”
4,是否可抢占
SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间优先算法(SRTN,Shortest Remaining Time Next)
5,优缺点
优点:“最短的”平均等待时间、平均周转时间
缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
6,是否会导致饥饿
会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死”
注意几个小细节:
1.如果题目中未特别说明,所提到的“短作业/进程优先算法”默认是非抢占式的
2.很多书上都会说“SJF调度算法的平均等待时间、平均周转时间最少”严格来说,这个表述是错误的,不严谨的。之前的例子表明,最短剩余时间优先算法得到的平均等待时间、平均周转时间还要更少应该加上一个条件“在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最少”;或者说“在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少”;如果不加上述前提条件,则应该说“抢占式的短作业/进程优先调度算法(最短剩余时间优先,SRNT算法)的平均等待时间、平均周转时间最少”
3.虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但相比于其他算法(如FCFS),SJF依然可以获得较少的平均等待时间、平均周转时间
4.如果选择题中遇到“SJF算法的平均等待时间、平均周转时间最少”的选项,那最好判断其他选项是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项
3,高响应比优先(HRRN,Highest Response Ratio Next)
1,算法思想
要综合考虑作业/进程的等待时间和要求服务的时间
2,算法规则
在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务
响应比=(等待时间+要求服务时间)/(要求服务时间)
3,用于作业/进程调度
即可用于作业调度,也可用于进程调度
4,是否可抢占
非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,才需要计算响应比
5,优缺点
综合考虑了等待时间和运行时间(要求服务时间)等待时间相同时,要求服务时间短的优先(SJF的优点)要求服务时间相同时,等待时间长的优先(FCFS的优点)对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
6,是否会导致饥饿
不会
2.2.6调度算法(2)
比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此下面这三种算法适合用于交互式系统。(比如UNIX使用的就是多级反馈队列调度算法)
1,时间片轮转(RR,Round-Robin)
1,算法思想
公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
2,算法规则
按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。
3,用于作业/进程调度
用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)
4,是否可抢占
若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到
5,优点和缺点
优点:公平;响应快,适用于分时操作系统;
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
6,是否会导致饥饿
不会
7,补充
如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法就会退化为先来先服务算法,并且会增大进程的响应时间,因此时间片不能太大
另一方面,进程调度、切换是有时间代价的,如果时间片太小,会导致进程切换过于频繁,系统会画大量时间来处理进程切换,从而导致实际用于进程执行的世界比例减少,可见时间片也不能太小。
一般来说,设计时间片时要让切换进程的开销占比不超过1%
2,优先级调度算法
1,算法思想
随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
2,算法规则
调度时选择优先级最高的作业/进程
3,用于作业/进程调度
既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的l/0调度中
4,是否可抢占
抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。
5,优点和缺点
优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。
缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
6,是否会导致饥饿
会
7,补充
就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种。
静态优先级:创建进程时确定,之后一直不变。
动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。
通常:
系统进程优先级高于用户进程
前台进程优先级高于后台进程
操作系统更偏好I/O型进程(或称I/O繁忙型进程)
注:与I/O型进程相对的是计算型进程(或称CPU繁忙型进程)
3,多级反馈队列调度算法
1,算法思想
对其他五种调度算法的折中权衡
2,算法规则
1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾
3.只有第k级队列为空时,才会为k+1级队头的进程分配时间片
3,用于作业/进程调度
用于进程调度
4,是否可抢占
抢占式的算法。在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。
5,优点和缺点
对各类型进程相对公平(FCFS的优点);
每个新到达的进程都可以很快就得到响应(RR的优点);
短进程只用较少的时间就可完成(SPF的优点);
不必实现估计进程的运行时间(避免用户作假);
可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/0密集型进程(拓展:可以将因1/0而阻塞的进程重新放回原队列,这样1/0型进程就可以保持较高优先级)
6,是否会导致饥饿
会
2.2.7多级队列调度算法
系统中按进程类型设置多个队列,进程创建成功后插入某个队列
队列之间可采取固定优先级,或时间片划分
固定优先级:高优先级空时低优先级进程才能被调度
时间片划分:如三个队列分配时间50%、40%、10%
各队列可采用不同的调度策略,如:
系统进程队列采用优先级调度
交互式队列采用RR
批处理队列采用FCFS
2.3同步与互斥
2.3.1进程同步,互斥的基本概念
1,什么是进程同步
并发性带来了异步性,有时需要进过进程同步解决这种异步问题。
异步性是指,各并发执行的进程以各自独立的。不可预知的速度向前推进。
有的进程之间需要相互配合地完成工作,各进程的工作推进需要通情一定的先后项序。
所以操作系统提供“进程同步”的机制来解决异步问题。
进程同步也称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要再某些位置上协调它们的工作次序而产生的制约关系,进程间的直接制约关系就是源于它们间的相互合作。
2,什么是进程互斥
一个时间段内只充许一个进程使用的资源称为临界资源。
对临界资源的访问,必须互斥地进行。
互斥,亦称间接制约的关系,进程互斥指当一个进程访间某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后。另一个进程才能去访问临界资证。
1,四个部分
对临界资源的互斥访间,可以在逻辑上分为如下四个部分:
1,进入区
负责检查是否可进入临界区,若可进入,则应设置正在访问临界资源的标志(可理解为“上锁”),以阻止其他进程同时进入临界区
2,临界区
访问临界资源的那段代码
3,退出区
负责解除正在访问临界资源的标志(可理解为“解锁”)
4,剩余区
其余代码部分
2,需要遵循的原则
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:
1.空闲让进
临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;
2.忙则等待
当已有进程进入临界区时,其他试图进入临界区的进程必须等待;
3.有限等待
对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿)
4.让权等待
当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。
2.3.2进程互斥的软件实现方法
1,单标志法
算法思想:
两个进程在游问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。
在进入区只做“检查”,不“上锁”
在退出区把临界区的使用权转交给另一个进程(相当于在退出区既给另一进程“解锁”,又给自己“上锁”)
主要问题:不遵循“空闲让进“原则
2,双标志先检查
算法思想:
设置一个布尔型数组fagll,数组中各个元素用来标记各进程想进入临界区的意愿,比如
“flag[O]=ture”意味着0号进程PO现在想要进入临界区。每个进程在进入临界区之前先检查当前有
没有别的进程想进入临界区,如果没有,则把自身对应的标志ftag设为true, 之后开始访问临界区。
双标志先检查法的主要问题是:违反“忙则等待”原则。
原因在于,进入区的“检查”和“上锁”两个处理不是一气呵成的。“检查”后,“上锁”前可能发生进程切换。
3,双标志后检查
在进入区先“加锁“后“检查”,退出区“解锁”
主要问题:
因此,双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待”
原则,会因各进程都长期无法访问临界资源而产生“饥饿”现象。
两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。
4,Peterson算法
算法思想:
结合双标志法、单标志法的思想。如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”(谦让)。做一个有礼貌的进程。
进入区:
1.主动争取;
2.主动谦让
3.检查对方是否也想使用,且最后一次是不是自己说了“客气话”
主要问题:不遵循“让权等待“原则,会发生“忙等”
2.3.3进程互斥的硬件实现方法
1,中断屏蔽方法
利用“开/关中断指令”实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)
优点:简单高效
缺点:不适用于多处理机:只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)
2,TestAndSet(TS指令/TSL指令)
TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。以下是用C语言描述的逻辑
相比软件实现方法,TSL指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞:适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
3,Swap指令(XCHG指令)
逻辑上来看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在old变量上),再将上锁标记lock设置为true,最后检查old,如果old为false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞:适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从
而导致“忙等”。
2.3.4互斥锁
解决临界区最简单的工具就是互斥锁(mutexlock)。一个进程在进入临界区时应获得锁;在退出临界区时释放锁。函数acquire获得锁,而函数release释放锁。
每个互斥锁有一个布尔变量available,表示锁是否可用。如果锁是可用的,调用acqiure()会
成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞,直到锁被释放。
acquire或release的执行必须是原子操作,因此互斥锁通常采用硬件机制来实现。
互斥锁的主要缺点是忙等待,当有一个进程在临界区中,任何其他进程在进入临界区时必须
连续循环调用acquire()。当多个进程共享同一CPU时,就浪费了CPU周期。因此,互斥锁通常
用于多处理器系统,一个线程可以在一个处理器上等待,不影响甚他线程的执行。
需要连续循环忙等的互斥锁,都可称为自旋锁(spin lock),如TSL指令、swap指令、单标志法
特性:
·需忙等,进程时间片用完才下处理机,违反“让权等待”
·优点:等待期间不用切换进程上下文,多处理器系统中,若上锁的时间短,则等待代价很低
·常用于多处理器系统,一个核忙等,其他核照常工作,并快速释放临界区
·不太适用于单处理机系统,忙等的过程中不可能解锁
2.3.5信号量机制
用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为1的信号量。
原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。
一对原语:wait(S)原语和signal(S)原语,可以把原语理解为我们自己写的函数,函数名分别为wait和signal,括号里的信号量S其实就是函数调用时传入的一个参数。
wait、signal 原语常简称为p、V操作(来自荷兰语proberen和verhogen)。因此,做题的时候常把wait(S)、signal(S)两个操作分别写为P(S)、V(S)。
1,整型信号量
用一个整数型的变量作为信号量,用来表示系统中某种资源的数量。
整型信号量与普通整型变量的区别:对信号量只能执行初始化、P、V三种操作
整型信号量存在的问题:不满足让权等待原则
2,记录型信号量
S.value表示某种资源数,S.L指向等待该资源的队列
P操作中,一定是先S.value–,之后可能需要执行 block原语
对信号量S的一次P操作意味着进程请求一个单位的该类资源,因此需要执行S.value–,表示资源数减1,当S.value<0时表示该类资源已分配完毕,因此进程应调用block原语进行自我阻塞(当前运行的进程从运行态→阻塞态),主动放弃处理机,并插入该类资源的等待队列(阻塞队列)S.L中。可见,该机制遵循了“让权等待”原则,不会出现“忙等”现象。
V操作中,一定是先S.value++,之后可能需要执行 wakeup 原语
对信号量S的一次v操作意味着进程释放一个单位的该类资源,因此需要执行S.value++,表示资源数加1。若加1后仍是S.value<=0,表示依然有进程在等待该类资源,因此应调用wakeup原语唤醒等待队列(进程的阻塞队列)中的第一个进程(被唤醒进程从阻塞态→就绪态)。
注意:要能够自己推断在什么条件下需要执行block或 wakeup
可以用记录型信号量实现系统资源的“申请“和“释放”
可以用记录型信号量实现进程互斥、进程同步
2.3.6用信号量机制实现进程互斥、同步、前驱关系
1,实现进程互斥
互斥问题,信号量初值为1
分析问题,确定临界区
设置互斥信号量,初值为1
临界区之前对信号量执行P操作
临界区之后对信号量执行V操作
2,实现进程同步
进程同步:要让各并发进程按要求有序地推进。
同步问题,信号量初值为0
分析问题,找出哪里需要实现“一前一后”的同步关系
设置同步信号量,初始值为0
在“前操作“之后执行V操作
在“后操作“之前执行P操作
(前VP后)
3,实现进程的前驱关系
前驱关系问题,本质上就是多级同步问题
分析问题,画出前驱图,把每一对前驱关系都看成一个同步问题
为每一对前驱关系设置同步信号量,初值为0
在每个“前操作”之后执行V操作
在每个“后操作“之前执行P操作
2.3.7管程
1,为什么要引入管程
解决信号量机制编程麻烦,易出错的问题
2,管程的组成
共享数据结构
对数据结构初始化的语句
一组用来访问数据结构的过程(函数)
管程有一个名字
3,管程的基本特征
-
1.局部于管程的数据只能被局部于管程的过程(函数)所访问;
-
2.一个进程只有通过调用管程内的过程(函数)才能进入管程访问共享数据;
-
3.每次仅允许一个进程在管程内执行某个内部过程。
2.3.8经典的同步互斥问题
生产者消费者
读写
吸烟者
哲学家问题
2.4死锁
2.4.1死锁的概念
1,什么是死锁
在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程都将无法向前推进。
2,死锁,饥饿,死循环的区别
都是进程无法顺利向前推进的现象(故意设计的死循环除外)
死锁:至少是两个进程一起死锁,死锁进程处于阻塞态
饥饿:可以只有一个进程饥饿,饥饿进程可能阻塞也可能就绪
死循环:可能只有一个进程发生死循环,死循环的进程可上处理机
死锁和饥饿是操作系统要解决的问题,死循环是应用程序员要解决的
3,死锁产生的必要条件
产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生。
互斥条件:
只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
不剥夺条件:
进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
请求和保持条件:
进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
循环等待条件:
存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
4,什么时候会发生死锁
1.对系统资源的竞争
各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
2.进程推进顺序非法
请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
3.信号量的使用不当也会造成死锁
如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)
5,死锁的处理策略
1.预防死锁
破坏死锁产生的四个必要条件中的一个或几个。
2.避免死锁
用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
3.死锁的检测和解除
允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
2.4.2预防死锁(不允许死锁发生的静态策略)
1,破坏互斥条件
把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如:SPOOLing技术。
缺点:可行性不高,很多时候无法破坏互斥条件
2,破坏不剥夺条件
方法一
当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。
方法二
当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点:
1.实现起来比较复杂。
2.释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
3.反复地申请和释放资源会增加系统开销,降低系统吞吐量
4.若采用方案一,意味着只要暂时得不到某个资源,前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
3,破坏请求和保持条件
可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源
该策略实现起来简单,但也有明显的缺点:有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
4,破坏循环等待条件
可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
该策略的缺点:
1.不方便增加新的设备,因为可能需要重新分配所有的编号;
2.进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费:
3.必须按规定次序申请资源,用户编程麻烦。
2.4.3避免死锁(不允许死锁发生的动态策略)
1,什么是安全序列
所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个。
2,什么是系统的不安全状态,与死锁的联系
如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况。
3,如何避免进入不安全状态—银行家算法
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是“银行家算法”的核心思想。
核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待。
2.4.4死锁的检测和解除(允许死锁发生)
1,如何检测
为了能对系统是否已发生了死锁进行检测,必须:
①用某种数据结构来保存资源的请求和分配信息;
②提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
1,数据结构:资源分配图
- 两种节点
进程节点:对应一个进程
资源节点:对应一类资源,一类资源可能有多个
- 两种边
进程节点→资源节点:表示进程想申请几个资源(每条边代表一个)
资源节点→进程节点:表示已经为进程分配了几个资源(每条边代表一个)
2,死锁检测算法
依次消除与不阻塞进程相连的边,直到无边可消
注:所谓不阻塞进程是指其申请的资源数还足够的进程
死锁定理:若资源分配图是不可完全简化的,说明发生了死锁
2,如何解除
一旦检测出死锁的发生,就应该立即解除死锁。补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
1.资源剥夺法
挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
2.撤销进程法(或称终止进程法)
强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
3.进程回退法
让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。