coredump简介与coredump原因总结

前言


       这周多在用gdb调试,转个对于调试segmentation fault比较实用的方法。当时,也是老话重谈。就当复习了。原本打算每天晚上学点Nginx,结果这块一直拖着,晚上回去尽关注通信人了...


内容


        转自博文:coredump简介与coredump原因总结


什么是coredump


        通常情况下coredmp包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息等。可以理解为把程序工作的当前状态存储成一个文件。许多程序和操作系统出错时会自动生成一个core文件。


如何使用coredump


        coredump可以用在很多场合,使用Linux,或者solaris的人可能都有过这种经历,系统在跑一些压力测试或者系统负载一大的话,系统就hang住了或者干脆system panic.这时唯一能帮助你分析和解决问题的就是coredump了。


        现在很多应该程序出错时也会出现coredump.

分析coredump的工具


        现在大部分类unix操作系统都提供了分析core文件的工具,比如 GNU Binutils Binary File Descriptor library (BFD), GNU Debugger (gdb),mdb等

coredump的文件格式


        类unix操作系统中使用efi格式保存coredump文件。

        在solairs下,bash-3.2# file *unix.3 ELF 32-bit LSB executable 80386 Version 1, statically linked, not stripped, no debugging information availableunix.4 ELF 32-bit LSB executable 80386 Version 1, statically linked, not stripped, no debugging information available


经验总结


        造成程序coredump的原因很多,这里根据以往的经验总结一下:


        1. 内存访问越界

        a) 由于使用错误的下标,导致数组访问越界

        b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符

        c) 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。
 

        2. 多线程程序使用了线程不安全的函数

        应该使用下面这些可重入的函数,尤其注意红色标示出来的函数,它们很容易被用错:
        asctime_r(3c) gethostbyname_r(3n) getservbyname_r(3n) ctermid_r(3s) gethostent_r(3n) getservbyport_r(3n) ctime_r(3c) getlogin_r(3c) getservent_r(3n) fgetgrent_r(3c) getnetbyaddr_r(3n) getspent_r(3c) fgetpwent_r(3c) getnetbyname_r(3n) getspnam_r(3c) fgetspent_r(3c) getnetent_r(3n) gmtime_r(3c) gamma_r(3m) getnetgrent_r(3n) lgamma_r(3m) getauclassent_r(3) getprotobyname_r(3n) localtime_r(3c) getauclassnam_r(3) etprotobynumber_r(3n) nis_sperror_r(3n) getauevent_r(3) getprotoent_r(3n) rand_r(3c) getauevnam_r(3) getpwent_r(3c) readdir_r(3c) getauevnum_r(3) getpwnam_r(3c) strtok_r(3c) getgrent_r(3c) getpwuid_r(3c) tmpnam_r(3s) getgrgid_r(3c) getrpcbyname_r(3n) ttyname_r(3c) getgrnam_r(3c) getrpcbynumber_r(3n) gethostbyaddr_r(3n) getrpcent_r(3n)
 

        3. 多线程读写的数据未加锁保护

        对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成core dump
 

        4. 非法指针

        a) 使用空指针

        b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型 的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它 时就很容易因为bus error而core dump.
 

        5. 堆栈溢出

        不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。

coredump文件的生成方法以及使用方法:

        (假设下例是在x86上交叉编译,而在arm上运行异常的现象)

        1. 在arm内核里加入coredump的支持(一般内核都支持coredump, 不用重编)

        2. 运行命令,此时允许coredump文件产生:(在arm上)

            ulimit –c unlimited

        3. 执行程序:(在arm上)

            ./test

        在异常退出时,会显示如下信息,注意括号里的内容 :Segmentation fault (core dumped),程序执行目录下将产生*core文件

        4. 用gdb分析:(在x86上)arm-linux-gdb ./test test.core

        5. 再用gdb的bt或where看就可以了!

系统支持生成core并设置存储位置的方法:

        1> 在/etc/profile中加入以下一行,这将允许生成coredump文件

             ulimit -c unlimited

        2> 在rc.local中加入以下一行,这将使程序崩溃时生成的coredump文件位于/tmp目录下:

             echo /tmp/core.%e.%p > /proc/sys/kernel/core_pattern  


        /tmp/也可以是其它的目录位置。最佳位置应当满足以下需求:

        * 对所有用户可写

        * 空间容量足够大

        * 掉电后文件不丢失



  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值