17.预防死锁

最新推荐文章于 2024-10-10 09:56:47 发布

大军001

最新推荐文章于 2024-10-10 09:56:47 发布

阅读量562

点赞数

java & JVM 同时被 2 个专栏收录

70 篇文章 1 订阅

订阅专栏

Java Concurrency

23 篇文章 0 订阅

订阅专栏

在一些场景中，去预防死锁是可能的。在这个内容中我将会描述三种技术：

锁排序
锁超时
死锁检测

锁排序

当多个线程需要相同的锁但是以不同的顺序获取他们的时候死锁就会发生。

如果你确定所有的锁在任何线程中都是相同的顺序，死锁就不会发生。看这个例子：

Thread 1:

  lock A 
  lock B


Thread 2:

   wait for A
   lock C (when A locked)


Thread 3:

   wait for A
   wait for B
   wait for C

如果一个线程，像线程3，需要几个锁，它就必须在固定的顺序获取他们。它就不能在之后的序列中获取一个锁直到已经获取到更早的锁。

例如，线程2和线程3都不能锁住C，直到他们首先锁住A。因为线程1持有了锁A，线程2和线程3必须首先等待直到锁A释放了。然后他们成功锁住A，在他们尝试去锁A或者B之前。

锁顺序是一个简单然而有效的死锁预防机制。然而，它只是在如果你知道所有的锁顺序的情况下使用。并不是所有的场景都是这样的。

锁超时

另外一个死锁预防机制就是在锁获取上设置一个超时，意味着尝试获取一个锁的线程将会只是尝试这些时间在放弃之前。如果一个线程在给予的超时时间内没有成功获取所有需要的锁，它将会倒退，释放所有获取的锁，等待一个随机的时间之后然后再尝试。等待的随机时间可以作为给予其他尝试获取相同锁的线程一个机会去获取所有的锁，并且因此应用程序继续运行不会锁住。

这里有一个例子，两个线程尝试获取相同的锁在不同的顺序中，这个线程将会倒退并且重试。

Thread 1 locks A
Thread 2 locks B

Thread 1 attempts to lock B but is blocked
Thread 2 attempts to lock A but is blocked

Thread 1's lock attempt on B times out
Thread 1 backs up and releases A as well
Thread 1 waits randomly (e.g. 257 millis) before retrying.

Thread 2's lock attempt on A times out
Thread 2 backs up and releases B as well
Thread 2 waits randomly (e.g. 43 millis) before retrying.

在上面的这个例子中，线程2将会重试获取这个锁大概200毫秒在线程1之前，并且很可能的成功获取这两个锁。已经尝试获取锁A的线程1然后等待。当线程2结束后，线程1将会能够获取这两个锁（除非线程1或者其他的线程在这个期间获取这个锁了）。

需要记住的一个问题是，只是因为一个锁超时了，就不需要意味着这个线程死锁了。它也只是意味着正在持有锁的这个线程（因为其他线程超时的）将会花时间去完成它的任务。

另外，如果足够多的线程竞争相同的资源，他们将会冒险尝试一次又一次的同时获取这个线程，甚至如果超时以及回退了。在重试之前有两个线程每一个等待时间在0到500毫秒之间的话，这个可能不会发生，但是如果10或者20个线程这个情况就不同了。然后在重试之前两个线程等待相同时间的可能性就会高很多了。

伴随着锁超时的一个问题就是，在java中不可能在同步代码块中设置一个超时时间。你将会不得不创建一个自定义的锁类或者使用java5中并发包中的一个。写自定义锁不难，但是超出了这篇文章的范围。在java并发路径后面的内容将会覆盖自定义锁。

死锁检测

死锁检测是一个更巨大的死锁预防机制，目的在于锁顺序不可能设置的，并且锁超时也不可行的。

每一次一个线程携带一个锁，它在一个线程和锁的数据结构中被记住的。另外的，一个线程无论什么时候需要一个锁，它也会被记在这个数据结构中。

当一个线程需要一个锁，但是这个请求被拒绝了，这个线程可能会遍历锁图去检查死锁。例如，如果一个线程A需要锁7，但是锁7被线程B持有，然后线程A会检查是否线程B已经请求线程A持有的锁的任何一个。如果线程B已经请求了，一个死锁已经发生了（线程A持有锁1，请求锁7，线程B持有锁7，请求锁1）。

当然一个死锁的场景可能会比两个线程彼此持有锁更加复杂。线程A可能等待线程B，线程B等待线程C，线程C等待线程D，并且线程D等待线程A。为了使得线程A检测一个死锁，它就必须过渡的检查所有被线程B需要的锁。来自线程B的请求的锁，线程A将会到达线程C，并且然后到达线程D，它就发现是线程A自己持有的一个锁。然后它就知道一个死锁已经发生了。

下面是一个锁获取的图示，并且被4个线程需要（A，B,C和D）。一个数据结构像这样就可以用来检测死锁。