本节基于王道考研《操作系统》课程记录的死锁相关笔记,视频指路2.4_1_死锁的概念_哔哩哔哩_bilibili
一、内涵
死锁:在并发环境不,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象。发生死锁后若无外力干涉,这些进程都将无法向前推进
1、死锁、饥饿、死循环的区别
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。
如短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑 bug 导致的,有时是程序员故意设计的。
2、死锁产生的必要条件
(1)互斥条件
只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的
(2)不剥夺条件
进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
(3)请求和保持条件
进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
(4)循环等待条件
存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
注意:发生死锁时一定有循环等待,但是发生循环等待时未必死锁
3、发生死锁的时机
1、对系统资源的竞争。
各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源 (CPU)的竞争是不会引起死锁的。
2、进程推进顺序非法。
请求和释放资源的顺序不当,也同样会导致死锁。
3、信号量的使用不当也会造成死锁。
综上:对不可剥夺资源的不合理分配,可能导致死锁
4、死锁的处理策略
(1)预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
(2)避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
(3)死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
4.1 预防死锁
4.1.1 破坏互斥条件
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。如SPOOLing技术。
操作系统可以采用 SPOOLing 技术把独占设备在逻辑上改造成共享设备。
缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
4.1.2 破坏不剥夺条件
(1)当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。即,某些资源尚未使用完也需要主动释放。
(2)当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级
缺点:
1、实现起来比较复杂。
2、释放已获得的资源可能造成前一阶段工作的失效。一般只适用于易保存和恢复状态的资源,如CPU。
3、反复地申请和释放资源会增加系统开销,降低系统吞吐量
4、若采用(1),意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
4.1.3 破坏请求与保持条件
静态分配方法:进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源
缺点:有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
4.1.4 破坏循环等待条件
顺序资源分配法:首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
缺点
1、不方便增加新的设备,因为可能需要重新分配所有的编号
2、进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费
3、必须按规定次序申请资源,用户编程麻烦。
4.2 避免死锁——银行家算法
安全序列:如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态。
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁
“银行家算法”的核心思想:可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。
数据结构:
(1)长度为m的一维数组Available :表示还有多少可用资源
(2)n*m矩阵Max表示各进程对资源的最大需求数
(3)n*m 矩阵Allocation 表示已经给各进程分配了多少资源
(4)Max-Allocation =Need 矩阵表示各进程最多还需要多少资源
(5)长度为m的一位数组Request 表示进程此次申请的各种资源数
银行家算法:
1、检查此次申请是否超过了之前声明的最大需求数
2、检查此时系统剩余的可用资源是否还能满足这次请求
3、试探着分配,更改各数据结构
4、用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法:检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。不断重复上述过程,看最终是否能让所有进程都加入安全序列。
4.3 死锁的检测与解除
条件:用某种数据结构来保存资源的请求和分配信息;提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
数据结构:
2种结点:(1)进程结点:对应一个进程(2)资源结点:对应一类资源,一类资源可能有多个
2种边:
(1)进程结点->资源结点:表示进程想申请几个资源 (每条边代表一个)
(2)资源节点->进程结点:表示已经为进程分配了几个资源 (每条边代表一个)
如果能消除所有边,就称这个图是可完全简化的,此时一定没有发生死锁
如果最终不能消除所有边,那么此时就是发生了死锁。最终还连着边的那些进程就是处于死锁状态的进程
4.3.1 死锁检测算法
1、在资源分配图中,找出既不阻塞又不是孤点的进程 Pi,即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。消去它所有的请求边和分配边,使之称为孤立的结点。
2、进程 Pi 所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁
4.3.2 死锁解除
主要方法有:
1、资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。应防止被挂起的进程长时间得不到资源而饥饿。
2、撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。优点:实现简单,缺点:所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一簧,以后还得从头再来。
3、进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程
的历史信息,设置还原点。
剥夺/撤销哪一个进程:
(1)进程优先级
(2)已执行多长时间
(3)还要多久能完成进程
(4)已经使用了多少资源
(5)进程是交互式的还是批处理式的