死锁是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。
死锁产生的必要条件
- 互斥:一个资源每次只能被一个进程使用。
- 占有并请求:一个进程因请求资源而阻塞时,对已获得的资源保持不放
- 不可剥夺:进程已获得的资源,在未使用完之前,不能强行剥夺。
- 循环等待:若干进程之间形成一种头尾相接的循环等待资源关系。
产生的主要原因
- 因为系统资源不足
- 进程运行推进的顺序不合适
- 资源分配不当等
死锁的解决方法
- 预防:通过设置某些限制条件,以破坏产生死锁的四个条件中的一个或者几个,防止发生死锁。
- 避免:系统在分配资源时根据资源的使用情况提前作出预测,从而避免死锁的发生。
- 检测:允许系统在运行的过程中产生死锁,但是,系统中有相应的管理模块可以及时检测出已经产生的死锁,并且精确地确定与死锁有关的进程和资源,然后采取适当措施,清除系统中已经产生的死锁。
- 解除:与检测死锁相配套的一种措施,用于将进程从死锁状态下解脱出来。
死锁的恢复
- 重新启动:这是最简单、最常用的死锁消除方法,但代价很大,因为在此之前所有进程已经完成的计算工作都将付之东流,不仅包括死锁的全部进程,也包括未参与死锁的全部进程。
- 终止进程(process termination):终止参与死锁的进程并回收它们所占资源。
- 一次性全部终止;
- 逐步终止(优先级,代价函数)
- 剥夺资源(resource preemption):剥夺死锁进程所占有的全部或者部分资源。
- 逐步剥夺:一次剥夺死锁进程所占有的一个或一组资源,如果死锁尚未解除再继续剥夺,直至死锁解除为止。
- 次剥夺:一次性地剥夺死锁进程所占有的全部资源。
- 进程回退(rolback):让参与死锁的进程回退到以前没有发生死锁的某个点处,并由此点开始继续执行,希望进程交叉执行时不再发生死锁。但是系统开销很大;
- 要实现“回退”,必须“记住”以前某一点处的现场,而现场随着进程推进而0动态变化,需要花费大量时间和空间。
- 一个回退的进程应当“挽回”它在回退点之间所造成的影响,如修改某一文件,给其它进程发送消息等,这些在实现时是难以做到的