来源:hazir
链接:http://www.cnblogs.com/hazir/p/linux_core_dump.html
当程序运行的过程中异常终止或崩溃,操作系统会将当时的内存状态记录下来,保存在一个文件中,这种行为就叫做Core Dump(中文有的翻译成”核心转储”).我们可以认为core dump是内存快照,但实际上,除了内存信息之外,还有些关键的程序运行状态也会同时dump下来,例如寄存器信息(包括程序指针,栈指针等),内存管理信息,其他处理器和操作系统状态和信息.core dump对于编程人员诊断和调试程序是非常有帮助的,因为对于有些程序错误是很难重现的,例如指针异常,而core dump文件可以再现程序出错时的情景.
Core Dump 名词解释
在半导体作为电脑内存材料之前,电脑内存使用的是磁芯内存(Magnetic Core Memory),Core Dump中的Core沿用了磁芯内存的Core表达.在APUE一书中作者有句话这样写的:
Because the file is named core, it shows how long thisfeature has been part of the Unix System.
这里的core就是沿用的早期电脑磁芯内存中的表达,也能看出Unix系统Core Dump机制的悠久历史.
Dump指的是拷贝一种存储介质中的部分内容到另一个存储介质,或者将内容显示,打印或者其它输出设备.dump出来的内容是格式化的,可以使用一些工具来解析它.
现代操作系统中,用Core Dump表示当程序异常终止或崩溃时,将进程此时的内存中的内容拷贝到磁盘文件中存储,以方便编程人员调试.
Core Dump如何产生
上面说当程序运行过程中异常终止或崩溃时会发生core dump,但还没说到什么具体的情景程序会发生异常终止或崩溃,例如我们使用kill -9 命令杀死一个进程会发生core dump吗?实验证明是不能的,那么什么情况会产生呢?
Linux中信号是一种异步事件处理的机制,每种信号对应有其默认的操作,你可以在这里查看Linux系统提供的信号以及默认处理.默认操作主要包括忽略该信号(Ingore),暂停进程(Stop),终止进程(Terminate),终止并发生core dump (core)等.如果我们信号均是采用默认操作,那么,一下列出几种信号,它们在发生时会产生core dump:
Signal | Action | Comment |
SIGQUIT | Core | Quit from keyboard |
SIGILL | Core | lllegal Instruction |
SIGABRT | Core | Abort signal from abort |
SIGSEGV | Core | Invalid memory reference |
SIGTRAP | Core | Trace/breakpoint trap |
|
|
|
当然不仅限于上面的几种信号.这就是为什么我们使用Ctrl+z来挂起一个进程或者Ctrl+C结束一个进程均不会产生core dump,因为前者会向进程发出SIGTSTP信号,该信号的默认操作为暂停进程(Stop Process);后者会向进程发出SIGINT信号,该信号默认操作为终止进程(Terminate Process).
同样上面提到的kill -9 命令会发出SIGKILL命令,该命令默认为终止进程.而我们使用Ctrl+来终止一个进程,会向进程发出SIGQUIT信号,默认是会产生core dump的。还有其它情景会产生core dump,如:程序调用abort()函数,访存错误,非法指令等等.
下面举两个例子来说明:
终端下比较Ctrl+C和Ctrl+:
小程序产生core dump
#include
int main()
{
Int*null_ptr = null;
*null_ptr= 10; // 对空指针指向的内存区域写,会发生段错误.
Return0;
}
Linux 下打开Core Dump
打开core dump功能
在终端中输入命令 ulimit –c,输出的结果为0,说明默认是关闭core dump的,即当程序异常终止时,也不会产生core dump文件.
我们可以使用命令ulimit –c unlimited来开启core dump功能,并且不限制core dump文件的大小;如果需要限制文件的大小,将ulimited改成你想生成core文件最大的大小,注意单位为blocks(KB).
用上面命令只会对当前的终端环境有效,如果想需要永久生效,可以修改文件/etc/security/limits.conf文件,关于此文件的设置参看这里.增加一行:
# /etc/security/limits.conf
#
#Each line describes a limit for a user inthe form:
#
#<domain> <type> <item><value>
l Soft core unlimited
修改core文件保存的路径
默认生成的core文件保存在可执行文件所在的目录下,文件名就为core.
通过修改/proc/sys/kernel/core_uses_pid文件可以让生成core文件名是否自动加上pid号.
例如echo 1 > /proc/sys/kernel/core_used_pid,生成的core文件名将会变成core.pid,其中pid表示该进程的PID.
还可以通过修改/proc/sys/kernel/core_pattern来控制生成core文件保存的位置以及文件名格式.
例如可以用echo “/tmp/corefile-%e-%p-%t” > /proc/sys/kernel/core_pattern设置生成的core文件保存在”/tmp/corefile”目录下,文件名格式为”core-命令名-pid-时间戳”.
使用gdb调试Core文件
产生了core文件,我们该如何使用该Core文件进行调试呢?Linux中可以使用GDB来调试core文件,步骤如下:
首先,使用gcc编译源文件,加上-g以增加调试信息;
按照上面打开core dump以使程序异常终止时能生成core文件;
运行程序,当core dump之后,使用命令gdb program core来查看core文件,其中program为可执行程序名,core为生成的core文件名.
下面用一个简单的例子来说明:
int func()
{
int* null_ptr = 0;
*null_ptr = 10;
return 0;
}
int main()
{
func();
return0;
}
编译加上调试信息(-g),运行之后core dump,使用gdb查看core文件:
从上面可以看出,我们还可以还原程序执行时的场景,并使用where可以查看当前程序调用的函数栈帧,还可以使用gdb中的命令查看寄存器,变量等信息.