一、进程的基本概念
-
多道程序设计
- 允许多个程序同时进入内存并运行,其目的是为了提高系统效率 并发环境
- 一段时间间隔内,单处理器上有两个或两个以上的程序同时处于开始运行但尚未结束的状态,并且次序不是事先确定的 并发程序
- 在并发环境中执行的程序
1. 进程的定义
进程是具有独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的独立单位,又称任务
- 是程序的一次执行过程
- 是正在运行程序的抽象
- 将一个CPU变幻成多个虚拟的CPU
- 系统资源以进程为单位分配,如内存、文件、…,每个具有独立的地址空间
- 操作系统将CPU调度给需要的进程
2. 进程控制块(PCB)
PCB:Process Control Block
- 又称进程描述符、进程属性
- 操作系统用于管理控制进程的一个专门数据结构
- 记录进程的各种属性,描述进程的动态变化过程
-
PCB是系统感知进程存在的唯一标志
- 进程与PCB是一一对应的
进程表:所有进程的PCB集合
PCB包含4部分内容:
-
进程描述信息
- 进程标识符(process ID),唯一,通常是一个整数
- 进程名,通常基于可执行文件名,不唯一
- 用户标识符(user ID)
- 进程组关系 进程控制信息
- 当前状态
- 优先级(priority)
- 代码执行入口地址
- 程序的磁盘地址
- 运行统计信息(执行时间、页面调度)
- 进程间同步和通信
- 进程的队列指针
- 进程的消息队列指针 所拥有的资源和使用情况
- 虚拟地址空间的状况
- 打开文件列表 CPU现场信息
- 寄存器值(通用寄存器、程序计数器PC、程序状态字PSW、栈指针)
- 指向该进程页表的指针
Linux:task_struct
Windows:EPROCESS、KPROCESS、PEB
二、进程状态及状态转换
进程的三种基本状态:运行态、就绪态、等待态
-
运行态(Running)
- 占有CPU,并在CPU上运行 就绪态(Ready)
- 已经具备运行条件,但由于没有空闲CPU,而暂时不能运行 等待态(Waiting/Blocked)
- 因等待某一事件而暂时不能运行
进程的其他状态:创建态、终止态、挂起态
-
创建态(New)
- 已完成创建一进程所必要的工作,但尚未同意执行该进程 终止态(Terminated)
- 终止执行后,进程进入该状态,可完成一些数据统计工作,并回收资源 挂起态(Suspend)
- 用于调节负载,其进程不占用内存空间,映像交换到磁盘上
进程队列:
- 操作系统为每一类进程建立一个或多个队列
- 队列元素为PCB
- 伴随进程状态的改变,其PCB从一个队列进入另一个队列
- 多个等待队列等待的事件不同
- 就绪队列也可以多个
- 单CPU情况下,运行队列中只有一个进程
三、进程控制
-
原语:完成某种特定功能的一段程序,具有不可分割性或不可中断性
- 原语的执行必须是连续的,在执行过程中不允许被中断(原子操作) 进程控制操作完成各状态之间的转换,由具有特定功能的原语完成
- 进程创建原语,进程撤消原语,阻塞原语,唤醒原语,挂起原语,激活原语,改变进程优先级,…
1. 进程的创建
-
给新进程分配一个唯一标识以及进程控制块
为进程分配地址空间
初始化进程控制块
- 设置默认值(如:状态为New,…) 设置相应的队列指针
- 如:把新进程加到就绪队列链表中
Unix:fork/exec
Windows:CreateProcess
2. 进程的撤消
-
收回进程所占有的资源
- 关闭打开的文件、断开网络连接、回收分配的内存、… 撤消该进程的PCB
- 意味着结束进程
Unix:exit
Windows:TerminateProcess
3. 进程的阻塞
处于运行状态的进程,在其运行过程中期待某一事件发生,如等待键盘输入、等待磁盘数据传输完成、等待其它进程发送消息,当被等待的事件未发生时,由进程自己执行阻塞原语,使自己由运行态变为阻塞态
Unix:wait
Windows:WaitForSingleObject
4. Unix的几个进程控制操作
-
fork()
- 通过复制调用进程来建立新的进程,是最基本的进程建立过程 exec()
- 包括一系列系统调用,它们都是通过用一段新的程序代码覆盖原来的地址空间,实现进程执行代码的转换 wait()
- 供初级进程同步操作,能使一个进程等待另外一个进程的结束 exit()
- 用来终止一个进程的运行
Unix示例:
- 为子进程分配一个空闲的进程描述符(proc结构)
- 分配给子进程唯一标识pid
- 以一次一页的方式复制父进程地址空间
- 从父进程处继承共享资源,如打开的文件和当前工作目录等
- 将子进程的状态设为就绪,插入到就绪队列
- 对子进程返回标识符0
- 向父进程返回子进程的pid
-
COW(Copy-On-Write)
- Linux采用写时拷贝技术,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程
使用fork()的示例代码:
pid = fork();
if (pid == 0) {
printf(“child”); // 子进程
} else {
printf(“parent”); // 父进程
}
四、进程相关概念
1. 进程分类
-
: 系统进程,用户进程
- 前台进程,后台进程
- CPU密集型进程,I/O密集型进程
Unix进程家族树:init为根
Windows:地位相同
2. 进程与程序的区别
- 进程更能准确刻画并发,而程序不能
- 程序是静态的,进程是动态的
- 进程有生命周期的,有诞生有消亡,是短暂的,而程序是相对长久的
- 一个程序可对应多个进程
- 进程具有创建其他进程的功能
操作系统为每个进程都分配了一个地址空间
3. 进程映像
进程映像是对进程执行活动全过程的静态描述
由进程地址空间内容、硬件寄存器内容及与该进程相关的内核数据结构、内核栈组成
-
用户相关
- 进程地址空间(包括代码段、数据段、堆和栈、共享库、…) 寄存器相关
- 程序计数器、指令寄存器、程序状态寄存器、栈指针、通用寄存器等的值 内核相关
- 静态部分:PCB及各种资源数据结构
- 动态部分:内核栈(不同进程在进入内核后使用不同的内核栈)
4. 上下文切换
将CPU硬件状态从一个进程换到另一个进程的过程称为上下文切换
-
进程运行时,其硬件状态保存在CPU上的寄存器中
- 程序计数器、程序状态寄存器、栈指针、通用寄存器、其他控制寄存器的值
进程不运行时,这些寄存器的值保存在进程控制块PCB中,当操作系统要运行一个新的进程时,将PCB中的相关值送到对应的寄存器中
五、线程的引入
为什么需要线程:
- 应用的需要
- 开销的需要
- 性能的需要
1. 应用的需要
-
典型的应用
- Web服务器 工作方式
- 从客户端接收网页请求(http协议)
- 从磁盘上检索相关网页,读入内存
- 将网页返回给对应的客户端 如何提高服务器工作效率
- 网页缓存(Web Page Cache)
构造服务器的三种方法:
模型 | 多线程 |
---|---|
多线程 | 有并发,阻塞系统调用 |
单线程进程 | 无并发,阻塞系统调用 |
有限状态机 | 有并发,非阻塞系统调用、中断 |
2. 开销的需要
进程时间和空间开销大,限制了并发度的提高,而线程的开销少
进程相关操作 | 线程相关操作 |
---|---|
创建进程 | 创建一个新线程花费时间少 |
撤消进程 | 撤消一个新线程花费时间少 |
进程通信 | 两个线程切换花费时间少 |
进程切换 | 线程之间相互通信无需调用内核(同一进程内的线程共享内存和文件) |
3. 性能的需要
-
多个线程,有的计算,有的I/O
- 多个处理器
进程的两个基本属性:
- 资源的拥有者(依然是进程)
- CPU调度单位(线程继承了这一属性)
线程:进程中的一个运行实体,是CPU的调度单位,有时将线程称为轻量级进程
线程的属性:
- 有标识符ID
- 有状态及状态转换 → 需要提供一些操作
- 不运行时需要保存的上下文(程序计数器等寄存器)
- 有自己的栈和栈指针
- 共享所在进程的地址空间和其他资源
- 可以创建、撤消另一个线程(程序开始是以一个单线程进程方式运行的)
六、线程机制的实现
- 用户级线程
- 核心级线程
- 混合模型
1. 用户级线程
POSIX线程库:PTHREAD
- POSIX(Portable Operating System Interface)
- 多线程编程接口,以线程库方式提供给用户
Thread call | Description |
---|---|
Pthread_create | Create a new thread |
Pthread_exit | Terminate the calling thread |
Pthread_join | Wait for a specific thread to exit |
Pthread_yield | Release the CPU to let another thread run |
Pthread_attr_init | Create and initialize a thread’s attribute structure |
Pthread_attr_destroy | Remove a thread’s attribute structure |
优点:
- 线程切换快
- 调度算法是应用程序特定的
- 用户级线程可运行在任何操作系统上(只需要实现线程库)
缺点:
- 内核只将处理器分配给进程,同一进程中的两个线程不能同时运行于两个处理器上
- 大多数系统调用是阻塞的,因此由于内核阻塞进程,故进程中所有线程也被阻塞
2. 核心级线程
3. 混合模型
本周重点
进程
并发性:任何进程都可以与其他进程一起向前推进
动态性:进程是正在执行程序的实例(动态产生,动态消亡,在三种基本状态之间转换)
独立性:进程是资源分配的一个独立单位(地址空间)
交互性:指进程在执行过程中可能与其他进程产生直接或间接的关系
异步性:每个进程都以其相对独立的、不可预知的速度向前推进
进程映像:程序 + 数据 + 栈(用户栈、内核栈) + PCB线程
多线程应用场景
线程基本概念、属性
线程实现机制
可再入程序:可被多个进程同时调用的程序,在执行过程中自身不改变,调用它的进程应该提供数据区