工作中遇到了死锁问题,先记录如下,欢迎大家提意见
先说说锁的定义:
锁作为一种同步机制,是为了防止多个线程对临界资源的访问。
这里请注意仅仅只是临界资源。
再来看看死锁形成的条件:
(1) 互斥条件:一个资源每次只能被一个进程(线程)使用。
(2) 请求与保持条件:一个进程(线程)因请求资源而阻塞时,对已获得的资源保持不放。
也就是说在锁内不应该有长时间处理的逻辑
(3) 不剥夺条件 : 此进程(线程)已获得的资源,在末使用完之前,不能强行剥夺。
(4) 循环等待条件 : 多个进程(线程)之间形成一种头尾相接的循环等待资源关系。
我这次遇到的是在锁内有一些逻辑,多个线程形成了循环等待资源的关系
1.用gdb -p exe
2.threads
3. 分别查看各个线程的bt情况
发现有几个线程等在__ll_lock_wait()上,等待其它线程释放锁
4.用frame查看锁的情况如下
(gdb) f 3 #3 0x0000000000400a17 in func2 () at lock.cpp:31 31 pthread_mutex_lock(&mutex1); (gdb) p mutex1 $1 = {__data = {__lock = 2, __count = 0, __owner = 6722, __nusers = 1, __kind = 0, __spins = 0, __list = {__prev = 0x0, __next = 0x0}}, __size = "\002\000\000\000\000\000\000\000B\032\000\000\001", '\000' <repeats 26 times>, __align = 2}这里重要的是p mutex1.它会打印出__owner的情况这里是6722这个也就是线程号。
在threads命令时看到。
thread 线程号
bt,可以看到这个线程获取了这个mutex,但没有释放
5.结合代码查看,修改问题