目录
1.用户级线程(User-Level Thread, ULT)
2.内核级线程(Kernel-Level Thread,KLT,又称“内核支持的线程”)
3.将n个用户级线程映射到m个内核级线程上(n>m)->多线程模型
一、进程的定义
程序段、数据段、PCB三部分组成了进程实体(进程映像)。一 般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。
注意:PCB是进程存在的唯一标志!
从不同的角度,进程可以有不同的定义,比较传统典型的定义有:(强调 “动态性”)
1. 进程是程序的一次执行过程。
2.进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
3. 进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。
引入进程实体的概念后,可把进程定义为:
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注:
严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非题目专门
考察二者区别,否则可以认为进程实体就是进程。因此我们也可以说“进程由程序段、数据段、PCB三部分组成。
二、进程的组成
进程(进程实体)由程序段、数据段、PCB三部分组成。
三、进程的组织
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式的问题。
1.链接方式
2.索引方式
四、进程的特征
1.动态性(最基本):进程是程序的一次执行过程,是动态地产生、变化和消亡的。
2.并发性:内存中有多个进程实体,各进程可并发执行。
3.独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位。
4.异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题。(异步性不会导致并发程序执行结果的不确定性。)
5.结构性:每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。
五、进程的状态
1.运行态(Running):占有CPU且在CPU上运行 --注:单核处理机环境下,每一时刻最多只有一个进程处于运行态(双核环境下可以同时有两个进程处于运行态)
2.就绪态(Ready):已经具备运行条件,但由于没有空闲CPU,而暂时不能运行。 ---进程已经拥有了除处理器之外所需要的资源,一旦获得处理机,即可立即进入运行态开始运行。
3.阻塞态(Waiting/Blocked,又称等待态):因等待某一时间而暂时不能运行。 ---等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部件,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能的得到CPU的服务。
4.创建态(New,又称新建态):进程正在被创建,操作系统为进程分配资源、初始化PCB
5.终止态(Terminated,又称结束态):进程正在从系统中撤销,操作系统会回收进程拥有的资源、撤销PCB
进程状态转换图
六、进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建进程,撤销已有进程、实现进程状态转换等功能。
简化理解:进程控制需要实现进程状态的转换
如何实现进程控制?
用原语实现进程控制。原语的特点是执行期间不允许中断,只能一气呵成。这种不可被中断的操作称为原子操作。
原语采用“关中断指令”和“开中断指令”实现
关/开中断指令是只允许在核心态下执行的特权指令
进程控制相关的原语
进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
1.更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
a.所有进程控制原语一定会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境
c.某进程开始运行前必然要恢复运行环境
2.将PCB插入合适的队列
3.分配/回收资源
A.创建
B.撤销
C.阻塞与唤醒
七、进程同步与进程互斥
进程同步
同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。
进程互斥
我们把一个时间段内只允许一个进程使用的资源称为临界资源。许多物理设备(摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。
对临界资源的访问,必须互斥地进行。互斥,亦称间接制约关系。进程互斥指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后,另一个进程才能去访问临界资源。
对于临界资源的互斥访问,可以在逻辑上分为如下四个部分:
注:
临界区是进程中访问临界资源的代码段
进入区和退出区是负责实现互斥的代码段。
临界区也可称为“临界段”
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:
1.空闲让进。临界区空闲时,可以允许一个请乘进入临界区的进程立即进入临界区:
2.忙则等待。当己有进程进入临界区时,其他试图进入临界区的进程必须等待
3.有限等待。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿);
4. 让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待
八、进程互斥的软件实现方法
单标志法
双标志先检查
双标志后检查
Peterson算法
九、进程互斥的硬件实现方法
中断屏蔽方法
TestAndSet
Swap指令
总结
十、进程通信
顾名思义,进程通信就是指进程之间的信息交换。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相对独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。
1.共享存储
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
基于存储区的共享:在内存中划出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通讯方式。
2.管道通信
“管道”是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的缓冲区。
1.管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设罝两个管道。
2.各进程要互斥地访问管道
3. 数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的readl系统调用将被阻塞。
4.如果没写满,就不允许读。如果没读空,就不允许写。
5. 数据一旦被读出,就从管道中被拋弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
3.消息传递
进程间的数据交换以格式化的信息(Messsage)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
直接通信方式
间接通信方式
九、线程概念和多线程模型
可以把线程理解为“轻量级进程"。
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一-步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
引入线程机制带来的变化
线程的属性
线程的实现方式
1.用户级线程(User-Level Thread, ULT)
用户级线程由应用程序通过线程库实现。
所有的线程管理工作都由应用程序负责(包括线程切换)
用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用
户级线程对用户不透明,对操作系统透明)
可以这样理解,“用户级线程” 就是“从用户视角看能看到的线程”
2.内核级线程(Kernel-Level Thread,KLT,又称“内核支持的线程”)
内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
“内核级线程”就是“从操作系统内核视角看能看到的线程”
3.将n个用户级线程映射到m个内核级线程上(n>m)->多线程模型
a.多对一模型:
多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理及上并行运行。
b.一对一模型:
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并发执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本太高,开销大。
c.多对多模型
n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。