coredump产生的几种可能情况和解决方法
一般C++产生coredump的原因有以下几种:
1 内存访问越界
a) 由于使用错误的下标,导致数组访问越界。
b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符。
c ) 使用strcpy, strcat, sprintf, strcmp,strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。
2 内存泄漏
分配的在堆上的内存没有释放,例如new了,没有free掉,一直到内存满了,系统coredump
3 多线程程序使用了线程不安全的函数。
应该使用多线程安全的函数代替不安全的api,例如:
gmtime() --> gmtime_r(); rand() --> rand_r();
4 多线程读写的数据未加锁保护。
对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成coredump
5,非法指针
a) 使用空指针
b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时就很容易因为bus error而core dump。
解决方法:
1. 使用gdb调试core文件, 打印出backtrace, 看core在哪个函数,然后 分析代码可以解决
2. 内存泄漏和越界有时候通过bt看不出来问题,因为内存之前就已经被破坏掉,这种情况应该先用工具分析下,
i)使用klocwork静态代码分析工具,把存在越界和new没有释放的地方修改好
ii)使用valgrind分析非法读写的地方
iii)以上两个工具都用了还是解决不了,再使用gdb调试...