参考链接:Debugging a mutex deadlock on Linux with gdb
死锁概念:
- 线程之间相互等待临界资源而造成彼此无法继续执行的情况。
出现死锁的必要条件:
- 互斥条件:一个资源每次只能被一个进程使用
- 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放
- 不剥夺条件:进程已获得的资源,在末使用完之前,不能强行剥夺
- 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系
死锁现象
- 两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去
gdb调试多线程死锁
- 首先找到出现死锁进程的pid
ps -ef | grep a.out
- 然后可以通过gdb -p 进程号,进入运行进程的gdb模式
gdb -p 102
- 使用info threads查看所有的线程运行信息
- 发现有lock_wait的即是正在等待锁释放,可以thread n进入某个子线程
- 比如进入到6#线程中,通过bt查看当前线程的堆栈情况,可以看到锁是等在了lock guard中,然后我们可以查看mutex栈中变量,参数mutex的值,或者通过info查看参数值;然后通过x/3d命令跟参数地址打印锁的部分变量值,下面展示了这个用法,打印出来的有3个值,分别代表 __lock, __count, and __owner,第三个值就表示当前等待的锁是被哪个线程持有,注意这块的652是线程标识符,这里必须手动查询出来线程标识符信息,可以通过之前的info threads命令查询出来。
- 然后可以定位到是96#线程持有,还是上述的方法,thread 96,进入线程查看堆栈,然后结合代码分析线程是否存在互斥锁的范围、是否存在多个不同互斥锁的问题