操作系统:死锁

一、死锁

1.1 死锁的概念

1.1.1 什么是死锁

每个人都占有一个资源, 同时又在等待另一个人手 里的资源。发生“死锁”

在并发环境下,各进程因竞 争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。 发生死锁后若无外力干涉, 这些进程都将无法向前推进。

1.1.2 死锁、饥饿、死循环的区别

死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。

饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF)算法 中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”。

死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑 bug 导致的,有时是程序员故意设计的。

在这里插入图片描述

1.1.3 死锁产生的必要条件

产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生。

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。 像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待 这种资源)。

不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。

请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放

循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求

注意!发生死锁时一定有循环等待,但是发生循环等待时未必死锁(循环等待是死锁的必要不充分条件)

如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有 一个,那循环等待就是死锁的充分必要条件了。

1.1.4 什么时候会发生死锁
  1. 对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资 源(CPU)的竞争是不会引起死锁的。

  2. 进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、 P2 分别申请并占有了资源 R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1, 两者会因为申请的资源被对方占有而阻塞,从而发生死锁。

  3. 信号量的使用不当也会造成死锁。如生产者-消费者问题中,如果实现互斥的P操作在实现同步的 P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资 源)

总之,对不可剥夺资源的不合理分配,可能导致死锁。

1.1.5 死锁的处理策略
  1. 预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
  2. 避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
  3. 死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措 施解除死锁。
1.1.6 小结

在这里插入图片描述

1.2 死锁的处理策 略 ——预防死锁

1.2.1 破坏互斥条件

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁

如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如: SPOOLing技术。 操作系统可以采用 SPOOLing 技术把独占设备在逻辑上改造成共享设备。比如,用SPOOLing技术将打 印机改造为共享设备…

在这里插入图片描述

该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件

1.2.2 破坏不剥夺条件

不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。

破坏不剥夺条件:

方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。

方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥 夺给优先级更高的进程使用)

该策略的缺点

  1. 实现起来比较复杂
  2. 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态 的资源,如CPU。
  3. 反复地申请和释放资源会增加系统开销,降低系统吞吐量
  4. 采用方案一,意味着只要暂时得不到某个资源之前获得的那些资源就都需要放弃以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿
1.2.3 破坏请求和保持条件

请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放

可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前, 不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。

该策略实现起来简单,但也有明显的缺点
有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费资源利用率极低。另外,该策略也有可能导致某些进程饥饿

如下图所示,C进程需要同时拥有资源1,资源2才能运行,若一直有源源不断的A或B进程占据相应的资源,C进程就会一直阻塞,导致进程饥饿

在这里插入图片描述

1.2.4 破坏循环等待条件

循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求

可采用顺序资源分配法。首先系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源同类资源(即编号相同的资源)一次申请完

原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。

假设系统中共有10个资源,编号为 1, 2, …… 10

在这里插入图片描述

该策略的缺点

  1. 不方便增加新的设备,因为可能需要重新分配所有的编号
  2. 进程实际使用资源的顺序可能和编号递增顺序不一致会导致资源浪费
  3. 必须按规定次序申请资源,用户编程麻烦
1.2.5 小结

在这里插入图片描述

1.3 死锁的处理策 略 ——避免死锁

1.3.1 什么是安全序列

你是一位成功的银行家,手里掌握着100个亿的资金… 有三个企业想找你贷款,分别是 企业B、企业A、企业T,为描述方便,简称BAT。 B 表示:“大哥,我最多会跟你借70亿…” A 表示:“大哥,我最多会跟你借40亿…” T 表示:“大哥,我最多会跟你借50亿…”

然而…江湖中有个不成文的规矩:如果你借给企业的钱总数达不到企业提出的最 大要求,那么不管你之前给企业借了多少钱,那些钱都拿不回来了…

刚开始,BAT三个企业分别从你这儿借了 20、10、30 亿 …

在这里插入图片描述

在这里插入图片描述

小结 安全序列、不安全状态、死锁的联系

在这里插入图片描述

所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个

如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重 回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况。 (比如A 先归还了10亿,那么 就有安全序列T->B ->A)

如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态

因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源 分配请求。这也是“银行家算法”的核心思想。

1.3.2 银行家算法

银行家算法是荷兰学者 Dijkstra 为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁

核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待

示例

思考:BAT 的例子中,只有一种类型的资源——钱,但是在计算机系统中会有多种多样的资源,应该怎么把算法拓展为多种资源的情况呢?

可以把单维的数字拓展为多维的向量。比如:系统中有5个进程 P0~P4,3 种资源 R0~R2,初始数量为 (10, 5, 7),则某一时刻的情况可表示如下:

在这里插入图片描述

此时系统是否处于安全状态?
思路:尝试找出一个安全序列… {P1,P3,P0,P2,P4}
依次检查剩余可用资源 (3, 3, 2) 是否能满足各进程的需求
可满足P1需求,将 P1 加入安全序列,并更新剩余可用资源值为 (5, 3, 2)
依次检查剩余可用资源 (5, 3, 2) 是否能满足剩余进程(不包括已加入安全序列的进程)的需求
可满足P3需求,将 P3 加入安全序列,并更新剩余可用资源值为 (7, 4, 3)
依次检查剩余可用资源 (7, 4, 3) 是否能满足剩余进程(不包括已加入安全序列的进程)的需求…… ……

以此类推,共五次循环检查即可将5个进程都加入安全序列中,最终可得一个安全序列。该算法 称为安全性算法。可以很方便地用代码实现以上流程,每一轮检查都从编号较小的进程开始检查。 实际做题时可以更快速的得到安全序列。

实际做题(手算)时可用更快速的方法找到一个安全序列: 经对比发现,(3, 3, 2)可满足 P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3 一定可以顺利的执行完,并归还资源。 可把 P1、P3 先加入安全序列。 (2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3) 剩下的 P0、P2、P4 都可被满足。同理,这些进程都可以加入安全序列

于是,5个进程全部加入安全序列,说明此时系统处于安全状态,暂不可能发生死锁

再看一个找不到安全序列的例子

在这里插入图片描述

经对比发现,(3, 3, 2)可满足 P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被 满足的,因此P1、P3 一定可以顺利的执行完,并归还资源。 可把 P1、P3 先加入安全序列。
(2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3)
剩下的 P0 需要 (8, 4, 3),P2 需要 (6, 5, 0),P4 需要 (4, 3, 4)
任何一个进程都不能被完全满足

于是,无法找到任何一个安全序列,说明此时系统处于不安全状态,有可能发生死锁

银行家算法

在这里插入图片描述

假设系统中有 n 个进程,m 种资源
每个进程在运行前先声明对各种资源的最大需求数, 则可用一个 n*m 的矩阵(可用二维数组实现)表示所 有进程对各种资源的最大需求数。不妨称为最大需求矩阵 MaxMax[i, j]=K 表示进程 Pi 最多需要 K 个资源 Rj。同理,系统可以用一个 n*m分配矩阵 Allocation表示对所有进程的资源分配情况。Max – Allocation = Need 矩阵,表示各进程最多还需要多少各类资源。 另外,还要用一个长度为m的一维数组 Available 表示当前系统中还有多少可用资源
某进程Pi向系统申请资源,可用一个长度为m的一维 数组 Requesti 表示本次申请的各种资源量

可用银行家算法预判本次分配是否会导致系统进入不安全状态:
①如果 Requesti [j]≤Need[i, j] (0≤j≤m)便转向②;否则认为出错。 (因为它所需要的资源数已超过它所宣布的最大值。 )
②如果 Requesti [j]≤Available[j] (0≤j≤m),便转向③ ;否则表示尚无足够资源,Pi必须等待。
③系统试探着把资源分配给进程Pi,并修改相应的数据(并非真的分配,修改数值只是为了做预判):

Available = Available - Requesti;
Allocation[i, j] = Allocation[i, j] + Requesti[j];
Need[i, j] = Need[i, j] – Requesti[j]

④操作系统执行安全性算法,检查此次资源分配后,系统是否处于安全状态。若安全,才正式分配;否则,恢复相 应数据,让进程阻塞等待。

小结

数据结构
长度为 m 的一维数组 Available 表示还有多少可用资源
n*m 矩阵 Max 表示各进程对资源的最大需求数
n*m 矩阵 Allocation 表示已经给各进程分配了多少资源
Max – Allocation = Need 矩阵表示各进程最多还需要多少资源
用长度为 m 的一位数组 Request 表示进程此次申请的各种资源数

银行家算法步骤
①检查此次申请是否超过了之前声明的最大需求数
②检查此时系统剩余的可用资源是否还能满足这次请求
试探着分配,更改各数据结构
④用安全性算法检查此次分配是否会导致系统进入不安全状态

安全性算法步骤
检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列, 并把该进程持有的资源全部回收不断重复上述过程,看最终是否能让所有进程都加入安全序列

系统处于不安全状态未必死锁,但死锁时一定处于不安全状态。系统处于安全状态一定不会死锁.

1.4 死锁的处理策略——检测和解除

如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁
死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来

1.4.1 死锁的检测

为了能对系统是否已发生了死锁进行检测,必须:
①用某种数据结构保存资源的请求和分配信息
②提供一种算法,利用上述信息来检测系统是否已进入死锁状态

在这里插入图片描述

如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去。
如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去。
相应的,这些被激活的进程执行完了之后又会归还一些资源,这样可能又会激活另外一些阻塞的进程…

如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)

如果最终不能消除所有边,那么此时就是发生了死锁

可以消除所有的边,说明未发生死锁
先把R2分配给P1,P1运行结束释放R1,R2,然后可以把R1分配给P2。P2运行结束释放资源就能消除所有的边
在这里插入图片描述

不能消除所有的边,说明发生了死锁
只有R3能运行并释放资源,但剩余的资源不够P1,P2分配,不能消除所有的边
在这里插入图片描述

检测死锁的算法:
1)在资源分配图中,找出既不阻塞又不是孤点的进程 Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如下图中,R1没有空闲资源,R2有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配变使之成为孤立的结点。在下图中,P1 是满足这一条件的进程结点,于是将P1的所有边消去。
2)进程 Pi 所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。在下图中,P2 就满足这样的条件。根据 1)中的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的

在这里插入图片描述

死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁

1.4.2 死锁的解除

一旦检测出死锁的发生,就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
解除死锁的主要方法有:

  1. 资源剥夺法挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿
  2. 撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
  3. 进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。

如何决定“对谁动手”

  1. 进程优先级(低优先级被剥夺)
  2. 已执行多长时间(执行时间短被剥夺)
  3. 还要多久能完成(剩余时间长被剥夺)
  4. 进程已经使用了多少资源(使用资源多被剥夺)
  5. 进程是交互式的还是批处理式的(批处理式被剥夺)
1.4.3 小结

在这里插入图片描述

参考视频:王道计算机考研 操作系统

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值