一.进程的基本知识
一.进程的定义
早期的计算机只支持单道程序,计算机的CPU,内存等都只为一道程序服务。程序的代码放在程序段内,在内存低地址部分,运行过程处理的数据存放在数据段内,在内存高地址部分
所以后来引入了多道程序技术,计算机可以并发运行多个程序。系统为每个运行的程序配置一个数据结构,称为进程控制块(PCB)
进程实体(静态):PCB、程序段、数据段三部分构成进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程。例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。PCB是进程存在的唯一标志。
进程(动态)的传统定义:
1.进程是程序的一次执行过程。
2.进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
3.进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位
引入进程实体后进程的定义:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
二.进程的组成
进程(进程实体)由程序段、数据段、PCB三部分组成。
PCB:存放操作系统用来管理进程的各种信息
程序段:存放程序代码
数据段:存放程序运行过程产生的数据,如全局变量、局部变量、宏定义
三.进程的组织
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
1.链接方式
2.索引方式
四.进程的特征
1.动态性:进程是程序的一次执行过程,是动态地产生、变化和消亡的
2.并发性:内存中有多个进程实体,各进程可并发执行
3.独立性:进程是能独立运行、独立获取资源、独立接受调度的基本单位
4.异步性:各进程按各自独立的、不可预知的速度向前推进,导致运行结果不确定,操作系统要提供"进程同步机制"来解决异步产生的问题
5.结构性:程序段、数据段、PCB三部分组成,每个进程都会配置一个PCB。
二.进程的状态与转换
一 .进程的状态
1.运行态(Running Man):占有并运行在CPU上
2.就绪态(Ready):已经具备运行条件,但没有空闲CPU,而暂时不能运行
3.阻塞态(Waiting/Blocked):因等待某一事件而暂时不能运行
4.创建态(New):进程正在被创建,操作系统为该进程分配系统资源、初始化PCB
5.终止态(Terminated):进程正在从系统中被撤销,操作系统会回收该进程拥有的系统资源、撤销PCB
二.进程状态的转换
创建态——>就绪态:系统完成一系列的创建进程工作后,变为就绪态
就绪态——>运行态:就绪态进程被调度,变为运行态
运行态——>就绪态:运行态的进程时间片,或处理机被强占后,变为就绪态
运行态——>阻塞态:运行态进程主动通过系统调用的方式申请某种系统资源,或者请求等待某件事件发生,变为阻塞态
阻塞态——>就绪态:申请的资源被分配,或等待的事件发生,变为就绪态
运行态——>终止态:运行态进程遇到不可修复的错误,变为终止态
三.进程控制
一.进程控制过程
1.创建态——>就绪态:创建进程(初始化PCB、分配系统资源)完成,修改PCB内容,放入就绪队列
2.就绪态——>运行态:恢复进程运行环境、修改PCB内容,从就绪队列中取出,开始运行
3.运行态——>阻塞态:保存进程运行环境、修改PCB内容,放入相应事件的阻塞队列中
4.阻塞态——>就绪态:修改PCB内容,从相应事件的阻塞队列中取出,提交到就绪队列中
5.运行态——>终止态:回收进程拥有的资源,撤销PCB
6.运行态——>就绪态:进程切换,需要保持进程运行环境、修改PCB内容,放入就绪队列中
二.原语控制进程
为了防止进程运行环境、PCB内容修改过程中被打断,需要使用原语实现进程控制
关/开中断指令是特权指令,必须在核心态下执行
四.进程通信
一.什么是进程通信
进程通信就是指进程之间的信息交换。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。为了进程安全,一个进程不允许直接访问另一个进程的地址空间,但进程间信息交换有时候是必要的。
二.进程通信方式
一.共享存储
系统会开辟一块共享空间,提供进程间通信,但两个进程对共享空间的访问必须是互斥的。
共享空间分类:
- 1.基于数据结构的共享:这种共享方式速度慢、限制多,是一种低级的通信方式。
- 2.基于存储区的共享:在内存中开辟一块共享存储区,数据结构、存储位置都由进程控制,而不是操作系统。是一种高级通信方式。
二.管道通信
管道:用于连接读写进程的一个共享文件(pipe),其实就是内存中开辟一个固定大小的缓冲区
1.管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
2.各进程要互斥地访问管道。
3.数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
4.如果没写满,就不允许读。如果没读空,就不允许写。
5.数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况
三.消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
消息传递分类:
- 直接通信方式:消息直接挂到接收进程的消息缓冲区队列中
- 间接通信方式:消息先发送到中间实体(信箱)中,也称信箱通信方式
五.线程
一.线程的引入
进程是程序的一次执行,一个QQ进程从宏观角度看可以同时发视频、发送消息、接收信息,但从微观角度,这些功能不可能由一个进程顺序执行,不然就看起来不能同时实现。为了进程实现宏观上功能同时运行,就引入了线程并发执行各种功能
二.线程的属性
1.线程是处理机调度的单位
2.多CPU计算机中,各个线程可占用不同的CPU
3.每个线程都有一个线程ID,线程控制块(TCB)
4.线程也有就绪、阻塞、运行三种基本状态
5.线程几乎不拥有系统资源
6.同一进程的不同线程间共享进程的资源
7.由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
8.同一进程中的线程切换,不会引起进程切换
9.不同进程中的线程切换,会引起进程切换
10.切换同进程内的线程,系统开销很小
三.线程引入带来的变化
六.线程的实现方式
一.用户级线程
用户级线程(User-Level Thread)由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)
用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)
二.内核级线程
内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
三.线程的实现
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上( n >= m)
操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
例如:左边这个模型中,该进程由两个内核级线程,三个用户级线程,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行。
四.多线程模型
1.一对多模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
2.一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
3.多对多模型:n用户及线程映射到m个内核级线程(n >= m) 。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。