六、线程
6.1 线程的引入
引入理由
- 应用的需要
- 开销的考虑
- 性能的考虑
6.1.1 应用的需要
我们看一个例子,一个web
服务器的工作方式
- 从客户端接收网页请求
- 从磁盘上检索相关的网页,读入内存(此时进程是停止的,直到读取完毕)
- 将网页返回给对应的客户端
可以看到每次从磁盘读取的时候进程都是暂停的,这样会导致性能低下
那如何提高服务器的工作效率?通常情况下是使用网页缓存
在
没有线程情况下的两种解决方案
- 一个服务进程undefined这种情况下也是一种顺序编程,虽然采用了缓存机制,但是性能同样不高。而如果设置多个进程,这多个进程之间又是相互独立的,有独立的地址空间,所以不能共享信息
- 有限状态机undefined这种方式编程模型复杂,采用非阻塞的
I/O
多线程的解决方式
**说明:**这是一个多线程的web
服务器的工作方式,首先读取客户端的请求,之后由分派线程将各个任务分派给工作线程,这里还是采用了网页缓存
于是我们可以看到一个web
服务器的实现有三种方式:
6.1.2 开销的考虑
6.1.3 性能的考虑
如果有多个处理器的话,一个进程就会有多个线程同时在执行了,这样可以极大的提高运行性能
6.2 线程的基本概念
线程的属性
- 有标识符
ID
- 有状态及状态转换
-->
需要提供一些操作 - 不运行时需要保存的上下文(程序计数器等寄存器)
- 有自己的栈和栈指针
- 共享所在进程的地址空间和其他资源
- 创建、撤销另一个线程(程序开始是以一个单线程方式运行的)
6.3 线程机制的实现
一般有三种实现机制
- 用户级线程
- 核心级线程
- 混合(两者结合)方法6.3.1 用户级线程
说明:线程是由运行时系统管理的,在内核中只有进程表。典型例子就是UNIX
undefinedPOSIX线程库–PTHREAD
- 优点
- 线程切换快
- 调度算法是应用程序特定的
- 用户级线程可运行在任何操作系统上(只需要实现线程库)
- 缺点
- 内核只将处理器分配给进程,同一进程中的两个线程不能同时运行于两个处理器上
- 大多数系统调用是阻塞的,因此,由于内核阻塞进程,故进程中所有线程也被阻塞。(可以在调用之前判断进行解决,如果是阻塞线程,那么就换其他线程)6.3.2 核心级线程6.3.3 混合模型
- 线程创建在用户空间完成
- 线程调度等在核心态完成
- 例子如
Solaris
操作系统
6.4 线程状态(Java)
0)新建:创建后尚未启动的线程处于这种状态。
1)运行:包括了 OS 中 Running 和 Ready 状态,也就是处于此状态的线程可能正在运行,也可能正在等待 cpu 为它分配执行时间
2)无限期等待:处于这种状态的线程不会被分配 cpu 执行时间,要等待其他线程显示唤醒。以下方法会让线程进入无限期等待 :
- 没有设置 timeout 的 object.wait()
- 没有设置 timeout 参数的 Thread.join()
- LockSupport.park()
3)有限期的等待:处于这种状态的线程也不会被分配 cpu 执行时间,不过无需等待被其他线程显示唤醒,而是在一定时间后,他们会由 OS 自动唤醒 1.设置了 timeout 的 object.wait() 方法 2. 设置了 timeout 参数的 Thread.join() 3.LockSupport.parkNanos()
4.LockSupport.parkUnit()
4) 阻塞:与"等待"的区别:
- 阻塞态在等待获取一个排它锁,这个事件将在另外一个线程放弃这个锁的时候发生
- 等待状态在等待一段时间或者唤醒动作。
5)结束:已终止线程的线程状态,线程已经结束执行。 进程的通信类型 - 共享存储器、管道、客户机-服务器系统(socket)
- 直接通信、间接通信(信箱)
管程(Monitors,也称监视器)(重点)
基本概念
一种程序结构,结构内的多个子程序(对象 “对象 (计算机科学)”)或模块 “模块 (程序设计)”))形成的多个工作线程 “工作 (信息学)”)互斥访问共享资源。
这些共享资源一般是硬件设备或一群变量。
管程实现了在一个时间点,最多只有一个线程在执行管程的某个子程序。与那些通过修改数据结构实现互斥访问的并发程序设计相比,管程实现很大程度上简化了程序设计。
管程提供了一种机制,线程可以临时放弃互斥访问,等待某些条件得到满足后,重新获得执行权恢复它的互斥访问。
1 死锁
- 临界资源
每次只允许一个进程访问的资源,分硬件临界资源、软件临界资源。 - 临界区
每个进程中访问临界资源的那段程序叫做临界区。
进程对临界区的访问必须互斥,每次只允许一个进程进去临界区,其他进程等待。
临界区管理的基本原则(重点)
①如果有若干进程要求进入空闲的临界区,一次仅允许一个进程进入
②任何时候,处于临界区内的进程不可多于一个。如已有进程进入自己的临界区,则其它所有试图进入临界区的进程必须等待
③进入临界区的进程要在有限时间内退出,以便其它进程能及时进入自己的临界区
④如果进程不能进入自己的临界区,则应让出CPU,避免进程出现“忙等”
1.1 死锁的定义
一组进程中,每个进程都无限等待被该组进程中另一进程所占用的资源,因而永远无法得到的资源,这种现象称为进程死锁,这一组进程就称为死锁进程。
如果发生死锁,会浪费大量系统资源,甚至导致系统崩溃,注意:
- 参与死锁的所有进程都在等待资源
- 参与死锁的进程是当前系统中所有进程的子集
1.2 死锁的产生原因
资源数量有限、锁和信号量错误使用。
- 资源的使用方式
“申请-分配-使用-释放”模式
- 可重用资源:可被多个进程多次使用,又可分为可抢占资源与不可抢占资源,如处理器、
I/O
部件、内存、文件、数据库、信号量等可抢占资源。 - 可消耗资源:只可使用一次、可创建和销毁的资源。如信号、中断、消息等。
1.3 活锁和饥饿
说明:
- 如图,这里有两个进程都需要使用资源
1
和资源2
。比如这两个进程都上cpu
执行,但是进程A
执行到第二句的时候需要使用资源2
,而进程B
执行到第二句的时候需要资源1
,但是此时恰好都不能获得各自的资源,这样就进入忙等待(进入轮询看资源是否可用),这就是活锁,也就是先加锁再轮询,这样导致两个进程既无进展也没有阻塞。这和死锁的概念的区别在于死锁的时候进程不能进入cpu
去执行。 - 饥饿:资源分配策略决定
死锁与“饥饿”
- 饥饿
进程在竞争资源时,一直得不到其想要的资源,因而得不到服务,此时系统中并没有死锁
1.4 产生死锁的必要条件
- 互斥使用(资源独占):一个资源每次只能给一个进程使用
- 占有且等待(请求和保持,部分分配):进程在申请新的资源的同时保持对原有资源的占有。
- 不可抢占(不可剥夺):资源申请者不能强行的从资源占有着手中多去资源,资源只能由占有着自愿释放
- 循环等待
存在一个进程等待队列{P1,P2,......,Pn}
,其中P1
等待P2
占有的资源,P2
等待P3
占有的资源,…,Pn
等待P1
占有的资源,形成一个进程等待环路。
2 资源分配图(RAG:Resource Allocation Graph)
用有向图描述系统资源和进程的状态
2.1 资源分配图画法说明
- 系统由若干类资源构成,一类资源称为一个资源类;每个资源类中包含若干个同种资源,称为资源实例。
- 资源类:用方框表示。资源实例:用方框中的黑圆点表示。进程:用圆圈中加进程名表示。
- 分配边:资源实例–>进程;申请边:进程–>资源类
2.2 死锁定理
- 如果资源分配图中没有环路,则系统中没有死锁;如果图中存在还礼则系统中可能存在死锁。
- 如果每个资源类中只包含一个资源实例,则环路是死锁存在的充分必要条件。例如:
2.3 资源分配图化简
化简步骤:
- 1、找一个非孤立、且只有分配边的进程结点,去掉分配边,将其变为孤立结点
- 2、再把相应的资源分配给一个等待该资源的进程,即将该进程的申请边变为分配边。
- 3、重复上述步骤直到找不到资源分配结点。完成之后如果所有结点都变为孤立结点则表示系统中没有死锁,否则系统存在死锁。
三、死锁预防
3.1 解决死锁的方法
- 不考虑此问题(鸵鸟算法)
- 不让死锁发生
- 死锁预防。这是一种静态策略:即设计合理的资源分配算法,不让死锁发生
- 死锁避免。这是一种动态策略:以不让死锁发生为目标,跟踪并评估资源分配过程,根据评估结构决策是否分配
- 让死锁发生
死锁检测和解除
3.2 死锁预防(Deadlock Prevention)(重点)
- 定义:在设计系统时,通过确定资源分配算法,排除发生死锁的可能性
- 具体做法:防止产生死锁的四个必要条件中任何一个条件的发生
3.2.1 破坏“互斥使用/资源独占”条件
- 资源转换技术:把独占资源变为共享资源
SPooling
技术的引入,解决不允许任何进程直接占有打印机的问题。设计一个“守护进程/线程”负责管理打印机,进程需要打印时, 将请求发给该daemon
,由它完成打印任务。
3.2.2 破坏“占有且等待”条件
- 实现方案1:要求每个进程在运行前必须一次性申请它所有求的所有资源,且仅当该进程所要资源均可满足时才给予一次性分配。当然,这种方案的资源利用率较低,容易出现“饥饿”现象。
- 实现方案2:在允许进程动态申请资源前提下规定,一个进程在申请新的资源不能立即得到满足而变为等待状态之前,必须释放已占有的全部资源,若需要再重新申请。
3.2.3 破坏“不可抢占”条件
- 实现方案
当一个进程申请的资源被其他进程占用时,可以通过操作系统抢占这一资源(两个进程优先级不同)
- 局限性:
该方法实现起来比较复杂,要付出很大的代价。- 反复地申请和释放资源
- 进程的执行被无限地推迟
只适用于状态易于保存和恢复的对主存资源和处理器资源的分配适用于资源。如cpu
和内存等。
3.2.4 破坏“循环等待”条件
- 通过定义资源类型的线性顺序实现
- 实施方案:资源有序分配法
把系统中所有资源编号,进程在申请资源时必须严格按资源编号的递增次序进行,否则操作系统不予分配。我们一般根据资源使用的频繁性来进行编号。例如解决哲学家就餐问题。 - 为什么资源有序分配法不会产生死锁?
起始就是进程申请的资源编号必须是递增的,比如进程P1
申请了资源1、3、9
,而进程P2
需要资源1、2、5
,那么进程P2
在申请时必须按照1、2、5
的顺序来申请,这样就破坏了环路条件,因为在申请到资源1
之前,后面的资源是申请不到的。
存在下述严重问题:
限制了新类型设备的增加。
造成对资源的浪费。
必然会限制用户简单、自主地编程。
四、死锁避免
- 定义:在系统运行过程中,对进程发出的每一个系统能满足的资源申请进行动态检查,并根据检查结果决定是否分配资源,若分配后系统发生死锁或可能发生死锁(不是安全状态),则不予分配,否则(安全状态)予以分配。
- 安全状态:如果系统中存在一个所有进程构成的安全序列
P1,P2,......,Pn
,则称系统处于安全状态。安全状态表示系统一定没有发生死锁。 - 安全序列
一个进程序列{P1,P2,......,Pn}
是安全的,如果对于每个进程Pi(1<= i <= n)
:它以后还需要的资源数量不超过系统当前剩余资源量与所有进程Pj(j < i)
当前占有资源量只和。 - 不安全状态:系统中不存在一个安全序列。一定会导致死锁。五、死锁避免算法:银行家算法这是
Dijkstra
在1965
年提出的,是仿照银行发放贷款时采取的控制方式而设计的一种死锁避免算法。 - 应用条件
1、在固定数量的进程中共享数量固定的资源。
2、每个进程预先指定完成工作所需的最大资源数量。
3、进程不能申请比系统中可用资源总数还多的资源。
4、进程等待资源的时间是有限的。
5、如果系统满足了进程对资源的最大需求,那么,进程应该在有限的时间内使用资源,然后归还给系统。
当进程Pi
提出资源申请时,系统执行下列步骤:
(1)若Request[i] <= Need[i]
,转(2);否则,报错返回。
(2)若Request[i] <= Available
,转(3);否则,报错返回。
(3)假设系统分配了资源,则有:
Available = Available - Request[i];
Allocation[i] = Allocation[i] + Request[i];
Need[i] = Need[i] = Request[i]
`</pre>
若系统新状态是安全的,则分配完成;若系统新状态是不安全的,则恢复原来状态,进程等待。
为了进行安全性检查,定义了数据结构:
安全性检查的步骤:
(1)`Work = Available; Finish = false;`
(2)寻找满足条件的`i`:
如果不存在,则转(4)
(3)
`Work = Work + Allocationi ;
转(2)
(4)若对所有i,Finish[i] == true
,则系统处于安全状态,否则,系统处于不安全状态。
六、死锁检测与解除
- 死锁检测
允许死锁发生,但是操作系统会不断监视系统进展情况,判断死锁是否真的发生。一旦死锁发生则采取专门的措施,解除死锁并以最小的代价恢复操作系统运行。
- 检测时机
1、当进程由于资源请求不满足而等待时检测死锁。这里缺点是系统开销较大。
2、定时检测
3、系统资源利用率下降时检测死锁
6.1 一个简单的死锁检测算法
6.2 死锁的解除
发生死锁后重要的是以最小的代价恢复系统的运行。方法如下:
- 撤销所有死锁进程,代价较大。
- 进程回退再启动,代价也较大
- 按照某种原则逐一死锁进程,直到不发生死锁
- 按照某种原则逐一抢占资源(资源被抢占的进程必须回退到之前的对应状态),直到不发生死锁 。