2.1_1_进程的概念、组成、特征
进程的概念
-
程序:是静态的,就是个存放在磁盘里的可执行文件,就是一系列的指令集合。
-
程序顺序执行的特征:顺序性、封闭性、可再现性。
-
程序并发执行的特征:间断性、失去封闭性、不可再现性。
-
进程(Process):是动态的,是程序的一次执行过程同一个程序多次执行会对应多个进程。
-
进程是程序的执行过程,是系统资源分配和调度的一个独立单位。
进程的组成
PCB
- PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收其PCB。
- 当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”—— PID(Process ID,进程ID)。
操作系统要记录PID、进程所属用户ID(UID)还要记录给进程分配了哪些资源(如:分配了多少内存、正在使用哪些I/O设备、正在使用哪些文件),还要记录进程的运行情况(如:CPU使用时间、磁盘使用情况、网络流量使用情况等)。
这些信息都被保存在一个数据结构PCB (Process Control Block)中,即进程控制块操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中。
程序段
程序的代码(指令序列)
数据段
运行中产生的各种数据(如:程序中定义的变量)
注意:
- PCB 是给操作系统用的。
- 程序段、数据段是给进程自己用的。
程序段、数据段、PCB三部分组成了进程实体(进程映像)
引入进程实体的概念后,可把进程定义为:
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
进程的特征
动态性
- 是程序最基本的特征。
进程是程序的一次执行过程,是动态地产生、变化和消亡的。
并发性
内存中有多个实体,各进程可并发执行。
独立性
进程是能独立运行、独立获得资源、独立接受调度的基本单位。
异步性
各进程按各自独立的、不可预知的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题。
结构性
每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。
2.1_2_进程的状态与转换、进程的组织
状态
创建态
- 进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化PCB。
就绪态
- 当进程创建完成后,便进入“就绪态”,处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,就暂时不能运行。
运行态
- 如果一个进程此时在CPU上运行,那么这个进程处于“运行态”。CPU会执行该进程对应的程序(执行指令序列)。
阻塞态
- 在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应)。在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入“阻塞态” 当CPU空闲时,又会选择另一个“就绪态”进程上CPU运行。
终止态
- 一个进程可以执行 exit 系统调用,请求操作系统终止该进程。此时该进程会进入“终止态”,操作系统会让该进程下CPU,并回收内存空间等资源,最后还要回收该进程的PCB。当终止进程的工作完成之后,这个进程就彻底消失了。
进程的组织
链式方式
- 按照进程状态将PCB分为多个队列。
- 操作系统持有指向各个队列的指针。
索引方式
- 根据进程状态的不同,建立几张索引表。
- 操作系统持有指向各个索引表的指针。
2.1_3_进程控制
什么是进程控制?
-
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现
进程状态转换等功能。
-
简化理解:反正进程控制就是要实现进程状态转换
如何实现进程控制?
- 用“原语”实现。
- 原语是一种特殊的程序,它的执行具有原子性。也就是说,这段程序的运行必须一气呵成,不可中断。
如何实现原语的“原子性”?
原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。
可以用 “关中断指令”和“开中断指令”这两个特权指令实现原子性。
-
正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有,
则暂停运行当前这段程序,转而执行相应的中断处理程序。
-
CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后
才会恢复检查。这样,关中断、开中断 之间的这些指令序列就是不可被中断的,这
就实现了“原子性”。
2.1_4_进程通信
什么是进程通信?
- 顾名思义,进程通信就是指进程之间的信息交换。进程是分配系统资源的单位(包括内存地址空间),
因此各进程拥有的内存地址空间相互独立。
-
为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实
现的。为了保证进程间的安全通信,操作系统提供了一些方法。
共享存储
-
两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。操作系统只负责提供共享空间和同步互斥工具(如P、V操作)。
-
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,
是一种低级通信方式。
-
基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操
作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
管道通信
-
三方面协调能力:互斥、同步、确定对方存在。
-
“管道”是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的
缓冲区。
-
管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置 两个管道。
-
各进程要互斥地访问管道。
-
数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据
取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
-
如果没写满,就不允许读。如果没读空,就不允许写。
-
数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情
况。
消息传递
进程之间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两
个原语进行数据交换。
消息
消息分为消息头和消息体。
-
消息头包括:发送进程ID、接受进程ID、消息类型、消息长度等格式化的信息(计算机网络中发送的“报
文”其实就是一种格式化的消息)。
-
消息体
直接通信方式
消息直接挂到接收进程的消息缓冲队列上。
间接通信方式
消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。
Eg:计网中的电子邮件系统。
2.1_5_线程的概念与特点
什么是线程,为什么要引入线程?
-
有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。
-
可以把线程理解为“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不
仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以
并发处理各种任务(如QQ视频、文字聊天、传文件)。
-
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。线程则作为处理机的分配单元。
引入线程机制后,有什么变化?
资源分配、调度
- 传统进程中,进程是资源分配、调度的基本单位。
并发性
- 引入线程后,各线程间也能并发,提升了并发度。
系统开销
- 传统的进程间并发,需要切换进程的运行环境,系统开销很大。
- 线程并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小。
- 引入线程后,并发所带来的系统开销减小。
2.1_6_线程的实现方式和多线程模型
线程的实现方式
用户级线程
历史背景:早期的操作系统(如:早期Unix)只支持进程, 不支持线程。当时的“线程”是由线程库实现的。
-
用户级线程(User-Level Thread, ULT)由应用程序通过线程库实现, 所有的线程管理工作都由应用程序负责(包 括线程切换)。
-
用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
-
在用户看来,是有多个线程。但是在操作 系统内核看来,并意识不到线程的存在。 “用户级线程”就是“从
用户视角看能看到的线程”。
-
优缺点
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统 开销小,效率高 。
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可 在多核处理机上并行运行。
内核级线程
- 由操作系统支持的线程。
-
内核级线程(Kernel-Level Thread, KLT, 又称“内核支持的线程”)的管理工作由操作系统内核完成。
-
线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
-
操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线
程进行管理。“内核级线程”就 是“从操作系统内核视角看能看到的线程”。
-
优缺点
优点:当一个线程被阻塞后,别的线程还可 以继续执行,并发能力强。多线程可在多核 处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程, 线程切换由操作系统内核完成,需要切换到核心态,因此线
程管理的成本高,开销大。
多线程模型
在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型。
一对一模型
-
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
-
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
-
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线
程管理的成本高,开销大。
多对一模型
-
多个用户级线程映射到一个内 核级线程。且一个进程只被分配一个内核级线程。
-
优点:用户级线程的切换在用户空间即可完 成,不需要切换到核心态,线程管理的系统开销小,效率高 。
-
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行 。
重点重点重点:
操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
多对多模型
-
n 用户及线程映射到 m 个内核级 线程(n >= m)。每个用户进程对应 m 个内核 级线程。
-
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。
内核级线程才是处理机分配的单位。
例如:多核CPU环境下,左边这个进程最多能被分配两个核。
-
一段“代码逻辑”只有获得了“运行机会”才能被CPU执行。
-
内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞。
2.2_1_调度的概念、层次
调度的基本概念
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理
这些任务的顺序,这就是“调度”研究的问题。
调度的三个层次
高级调度
作业:一个具体的任务。
用户向系统提交一个作业 ≈ 用户让系统启动一个程序(来处理一个具体的任务)
- 高级调度(作业调度)。按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。
- 简化理解:好几个程序需要启动,到底先启动哪个。
低级调度
-
低级调度(进程调度/处理机调度)—— 按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
-
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。进程调度的频率很高,一般几十毫秒一次。
中级调度
-
内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。
-
暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列
中级调度(内存调度)——按照某种策略决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
补充知识:进程的挂起态与七状态模型
三层关系的联系、对比
2.2_2_进程调度的时机、切换与过程、方式
时机
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
方式
切换与过程
“狭义的进程调度”与“进程切换”的区别:
-
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
-
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
-
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
-
对原来运行进程各种数据的保存
-
对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,
使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。