2.4.1 死锁的概念
知识总览
1. 什么是死锁
在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程都将无法向前推进。
- 例子1
- 例子2
2. 进程死锁、饥饿、死循环的区别
- 死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
- 饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。
- 比如:在短进程优先(SPF)算法中,若有源源不断地短进程的到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”。
- 死循环:某程序执行过程中一直跳不出某个循环的现象。
- 有时是因为程序逻辑bug导致的,有时是程序员故意设计的。
- 对比
3. 产生死锁的必要条件
产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生
- 互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子,打印机设备)。
- 像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
- 不剥夺条件:进程所获得的资源在未使用完前,不能由其他进程强行夺走,只能主动释放。
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
- 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
- !!!注意:发生死锁时一定有循环等待,但是发生循环等待时未必死锁(循环等待是死锁的必要不充分条件)
- 如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了。
- 例如
4. 什么时候会发生死锁
- 对资源的竞争。
- 各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
- 进程推进顺序非法。
- 请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
- 信号量的使用不当也会造成死锁。
- 如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁(可以把互斥信号量、同步信号量也看作是一种抽象的系统资源)
- 总之,对不可剥夺资源的不合理分配,可能导致死锁。
5. 死锁的处理策略
- 预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
- 避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
- 死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
& 知识总结
2.4.2 死锁的处理策略——预防死锁
知识总览
1. 破坏互斥条件
- 互斥条件:只有对必须使用的资源的争抢才会导致死锁。
- 该策略缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
2. 破坏不剥夺条件
- 不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
- 该策略缺点:
- 实现起来比较复杂;
- 释放已经获得的资源可能造成前一阶段的工作失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
- 反复地申请和释放资源会增加系统开销,降低系统吞吐量。
- 若采用方案一,意味着只要暂时的不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
3. 破坏请求和保持条件
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
- 该策略实现起来简单,但也有明显的缺点:有些资源可能只需要用很短的时间,因此如果一个进程的整个运行期间都一直保持着一个资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
- 例如:如果有源源不断地A类和B类进程,那么C类进程可能导致饥饿。(A类进程申请到资源1即可运行,B类进程申请到资源2即可运行,C类进程需要申请到资源1和2才可运行)
4. 破坏循环等待条件
- 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
该策略的缺点:
- 不方便增加新的设备,因为可能需要重新分配所有的编号;
- 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;
- 必须按规定次序申请资源,用户编程麻烦。
& 知识总结
2.4.3 死锁的处理策略——避免死锁
知识总览
1. 什么是安全序列
- 例子:
此时……B还想借30亿,你敢借吗?假如答应了B的请求……
此时……A还想借20亿,你敢借吗?假如答应了A的请求……
经过三百六十度无死角检查,给A借20亿时安全的……因为按照 T->B->A,A->T->B 的顺序给他们借钱是可行的……
2. 安全序列、不安全状态、死锁的联系
刚才例子的分析可知,有些资源请求不可以答应,有些资源请求可以答应。
- 安全序列:就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全系列可能有多个。
- 如果分配了资源之后,系统中找不到任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况。
- 如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)
- 因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是“银行家算法”的核心思想。
3. 银行家算法
核心思想:在资源分配之前预先判断这次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次资源请求,让该进程先阻塞等待。
- 思考:BAT例子中,只有一种类型的资源——钱,但是在计算机系统中会有多种多样的资源,应该怎么把算法拓展为多种资源的情况呢?
- 此时系统是否处于安全状态?
- 思路:尝试找出一个安全序列……
- 改变数值,此时系统是否处于安全状态?
分析:
算法
& 知识总结
2.4.4 死锁的处理策略——检测和解除
知识总览
- 如果系统不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
- 死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁。
- 死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
1. 死锁的检测
- 为了能对系统是否已经发生了死锁进行检测,必须:
- 用某种数据结构来保存资源的请求和分配信息;
- 提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
尝试用数据结构——图的知识定义这个数据结构
分析理解:
- 如果系统中剩余可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去
- 如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源地进程被激活,并顺利地执行下去。(如下图)
- 相应的,这些被激活的进程执行完之后,又会归还一些资源,这样可能又会激活另外一些阻塞地进程……
- 如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)
- 如果最终不能消除所有边,那么此时就是发生了死锁
- 不能消除所有边的例子
- 所以:最终还连着边地那些进程就是处于死锁状态的进程。
算法:
- 死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁。
- 思考:既然检测到了死锁,那采用什么办法解除?
2. 死锁的解除
- 注意:并不是系统中所有的进程都是死锁状态
- 用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
- 解除死锁的主要方法有:
- 资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
- 撤销进程法(或终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
- 进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。
如何决定“对谁动手”?
- 进程优先级
- 已执行多长时间
- 还要多久能完成
- 进程已经使用了多少资源
- 进程是交互式还是批处理式的