【操作系统】如何排查死锁?

【操作系统】如何排查死锁?

死锁的概念

死锁(Dead Lock)指的是两个或两个以上的运算单元(进程、线程或协程),都在等待对方释放资源,但没有一方提起释放资源,从而造成了一种阻塞的现象就称为死锁。

比如线程 1 拥有了锁 A 的情况下试图获取锁 B,而线程 2 又在拥有了锁 B 的情况下试图获取锁 A,这样双方就进入相互阻塞等待的情况,如下图所示:

image-20230306134138304

死锁的代码实现如下:

/**
 * @description: 死锁
 * @author: blblccc
 * @date: 2023/3/6 13:41
 */
public class DeadLockTest {
    public static Object A = new Object();
    public static Object B = new Object();

    public static void main(String[] args) {

        new Thread(() -> {
            synchronized (A) {
                try {
                    System.out.println("线程1 抢占A");
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
                synchronized (B) {
                    System.out.println("线程1 抢占B");
                }
            }
        }).start();

        new Thread(() -> {
            synchronized (B) {
                try {
                    System.out.println("线程2 抢占B");
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
                synchronized (A) {
                    System.out.println("线程2 抢占A");

                }
            }
        }).start();
    }
}

以上程序的执行结果如下图所示:

image-20230306134301153

从上述结果可以看出,线程 1 和线程 2 都在等待对方释放锁,这样就造成了死锁问题。 哪死锁应该如何排查呢?

死锁的排查工具

排查工具 1:jstack

在使用 jstack 之前,先要通过 jps 得到运行程序的进程 ID,使用方法如下:

image-20230306134331349

“jps -l”可以查询本机所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一个显示当前所有 Java 进程 pid 的命令,适合在 linux/unix/windows 平台上简单查看当前 Java 进程的一些简单情况,“-l”用于输出进程 pid 和运行程序完整路径名(包名和类名)。

有了进程 ID(PID)之后,我们就可以使用“jstack -l PID”来发现死锁问题了,如下图所示:

image-20230306134413119

jstack 用于生成 Java 虚拟机当前时刻的线程快照,“-l”表示长列表(long),打印关于锁的附加信息。

排查工具 2:jconsole

使用 jconsole 需要打开 JDK 的 bin 目录,找到 jconsole 并双击打开,如下图所示:

image-20230306134436609

然后选择要调试的程序,如下图所示:

image-20230306134452091

之后点击连接进入,选择“不安全的连接”进入监控主页,如下图所示:

image-20230306134505986

之后切换到“线程”模块,点击“检测死锁”按钮,如下图所示:

image-20230306134518790

之后稍等片刻就会检测出死锁的相关信息,如下图所示:

image-20230306134530534

死锁的发生条件

互斥条件

互斥条件是指多个线程不能同时使用同一个资源

比如下图,如果线程 A 已经持有的资源,不能再同时被线程 B 持有,如果线程 B 请求获取线程 A 已经占用的资源,那线程 B 只能等待,直到线程 A 释放了资源。

img

持有并等待条件

持有并等待条件是指,当线程 A 已经持有了资源 1,又想申请资源 2,而资源 2 已经被线程 C 持有了,所以线程 A 就会处于等待状态,但是线程 A 在等待资源 2 的同时并不会释放自己已经持有的资源 1

img

不可剥夺条件

不可剥夺条件是指,当线程已经持有了资源 ,在自己使用完之前不能被其他线程获取,线程 B 如果也想使用此资源,则只能在线程 A 使用完并释放后才能获取。

img

环路等待条件

环路等待条件指的是,在死锁发生的时候,两个线程获取资源的顺序构成了环形链

比如,线程 A 已经持有资源 2,而想请求资源 1, 线程 B 已经获取了资源 1,而想请求资源 2,这就形成资源请求等待的环形图。

img

避免死锁问题的发生

前面我们提到,产生死锁的四个必要条件是:互斥条件、持有并等待条件、不可剥夺条件、环路等待条件。

那么避免死锁问题就只需要破环其中一个条件就可以,最常见的并且可行的就是使用资源有序分配法,来破环环路等待条件

那什么是资源有序分配法呢?

线程 A 和 线程 B 获取资源的顺序要一样,当线程 A 是先尝试获取资源 A,然后尝试获取资源 B 的时候,线程 B 同样也是先尝试获取资源 A,然后尝试获取资源 B。也就是说,线程 A 和 线程 B 总是以相同的顺序申请自己想要的资源。

我们使用资源有序分配法的方式来修改前面发生死锁的代码,我们可以不改动线程 A 的代码。

我们先要清楚线程 A 获取资源的顺序,它是先获取互斥锁 A,然后获取互斥锁 B。

所以我们只需将线程 B 改成以相同顺序的获取资源,就可以打破死锁了。

img

总结

简单来说,死锁问题的产生是由两个或者以上线程并行执行的时候,争夺资源而互相等待造成的。

死锁只有同时满足互斥、持有并等待、不可剥夺、环路等待这四个条件的时候才会发生。

所以要避免死锁问题,就是要破坏其中一个条件即可,最常用的方法就是使用资源有序分配法来破坏环路等待条件。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 好的,首先你需要打开 Windbg,并连接到你想要排查的系统。然后你可以使用 !locks 命令来查看系统中所有的锁,并用 !dlk 命令来检查锁的情况。 如果你想要更深入地排查死锁,你可以使用 !threads 命令来查看所有的线程,并使用 ~*k 命令来查看每个线程的栈。这样你就可以找到可能导致死锁的函数调用。 此外,你还可以使用 !analyze -v 命令来分析死锁的原因,它会对系统中的所有锁进行分析,并给出建议的解决方案。 最后,你可以使用 .dump /ma 命令来生成内存转储文件,然后使用 !analyze -v 命令来分析转储文件,这样你就可以在离线状态下排查死锁。 ### 回答2: Windbg是一款用于Windows调试的强大工具,可以用于排查死锁问题。下面将介绍如何使用Windbg来排查死锁问题。 首先,通过命令行方式打开Windbg,然后导入相关的符号文件。接下来,可以通过以下几个步骤来查找死锁: 1. 设置调试器为检测死锁模式。在命令行中输入"!locks"命令,这会显示当前系统上所有的锁资源情况。查看输出结果,可以找到被锁定的对象和相应的线程信息。 2. 定位死锁线程。使用"~*"命令列出所有的线程,然后使用"~#s"命令查看每个线程的堆栈信息。在堆栈中查找是否存在死锁线程的迹象,例如相互等待锁资源或无法进一步执行的情况。 3. 分析死锁原因。使用"!analyze"命令分析死锁信息,这将提供一些相关的调试信息,帮助我们找到问题的根源。通常,是由于资源的竞争导致死锁的发生。 4. 查看锁资源情况。通过"!handle"命令查看系统中所有的句柄信息,找到被死锁线程所持有的句柄。然后,可以使用"!object"命令查看句柄对应的对象信息,找到造成死锁的具体原因。 5. 解决死锁问题。根据分析结果,采取相应的解决措施来解决死锁问题。可能的解决办法包括:调整锁资源的使用顺序、增加锁资源的数量或使用更高级别的锁对象等。 通过以上步骤,我们可以利用Windbg来定位和解决死锁问题。这个过程需要一定的调试经验和分析能力,但通过合理使用Windbg的调试命令,可以有效地排查死锁问题,提高系统的稳定性和性能。 ### 回答3: Windbg是一种强大的调试工具,可以用来分析和解决死锁问题。在排查死锁时,可以按照以下步骤进行操作: 1. 获取dump文件:首先,通过Windbg获取应用程序的dump文件,dump文件保存了应用程序在死锁发生时的内存和线程状态信息。 2. 加载dump文件:打开Windbg,选择“文件”菜单中的“打开转储文件”选项,然后选择要加载的dump文件。 3. 分析线程堆栈:使用Windbg命令"!analyze -v"分析线程堆栈。这个命令会提供线程堆栈的详细信息,包括当前线程和其它线程的调用栈。 4. 查找死锁引起的资源:使用Windbg的命令"!locks"来查找死锁引起的资源。这个命令会显示所有的锁、线程和资源之间的关系。通过查看这些信息,可以找到死锁的根本原因。 5. 跟踪线程执行路径:通过Windbg的命令"kb"或"~*"查看所有线程的执行路径,定位到正在等待某个资源的线程。 6. 分析死锁情况:根据线程堆栈和资源锁等信息,判断是什么原因导致了死锁的发生,比如是否存在互斥锁的竞争、资源的有界性等问题。 7. 修复死锁问题:根据分析结果,对死锁问题进行修复,可能需要修改代码逻辑、优化资源的使用方式、增加资源数量等手段来解决。 需要注意的是,在使用Windbg进行死锁排查时,需要对调试工具的使用有一定的经验和理解。同时,死锁问题的排查也可能是一项复杂的任务,需要仔细的分析和调试。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小颜-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值