偶尔遇到了个userspace的segment fault 的问题,从网上搜了下debug的方法
环境是arm64 Linux4.9
链接:https://www.doulos.com/knowhow/arm/Embedded_Linux_Debugging_User_Space_Seg_Faults/
参照链接中的方法debug:
1、异常的时候Linux dmesg 根本没打出来segfault 类似的LOG也没有call stack打出来!?
2、加LOG夹问题的位置发现出现问题的位置是有几个函数的调用,没办法理清具体哪个函数,静态分析(钛合金肉眼)看不出来哪里指针会有问题
3、因为系统默认没有加gdb所以先查查其他方法
经历以上步骤把链接里的方法废了,查google 发现可以利用sigsegv信号的handle 来dump当前的callstack,测试下该方法的可行性
代码:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
void usr_dump(int signo)
{
void *array[30];
int symcnt,j;
char **string;
symcnt=backtrace(array,30);
string=backtrace_symbols(array,symcnt);
if(string == NULL)
{
printf("can not get sym\n");
return;
}
printf("user dump start\n");
for(j=0;j<symcnt;j++)
printf("%s\n",string[j]);
printf("user dump end\n");
return;
-->exit(0);
}
int main (void)
{
char * ptr=0;
signal(SIGSEGV,&usr_dump);
*ptr = 0;//触发seg fault
return 0;
}
![](https://i-blog.csdnimg.cn/blog_migrate/6d5ca5ee9d9eca42a08f0da4eba11245.png)
gcc seg_test.c 然后运行./a.out
gcc 编译出的a.out难道strip过?addr2line竟然没查到这个地址,readelf -S a.out 看下确实没有看到debug段
重新编译gcc -g seg_test.c 然后运行./a.out ,call stack 跟strip版本的一样
13行竟然是usr_dump 函数?!
问题很显然这不是个正确的位置而且这个dumpstack 是一直在不停的打印像是死循环一样, 在sighandle 里调用下exit(0);就不会循环打印了。
搜索资料时遇到了 async-signal-safe的问题
博客链接 https://blog.csdn.net/ldong2007/article/details/4271685
猜测在sighandle中出不来的原因是backtrace 函数和prinf 函数都不是async-signal-safe的函数,所以会导致死锁在signal handle
(btw userspace的signal handle 是执行时机是do_signal 线程从陷入内核(中断/系统调用等)返回user space的时候才会执行)
==================================================================
Gdb 和core dump的方法同样的能有效的定位到seg fault,这时候就不用在去注册SIGSEGV的handle了
shell ulimit -c unlimited //打开core dump 功能
运行程序得到core 文件
gdb ./a.out core
bt//得到callstack
与用sighandle 得到的结果是一致的!!!