Core_Dump for Linux and Windows

Linux

    序崩溃时,内核有可能把该程序当前内存映射到 core 文件里,方便程序员找到程序出现问题的地方。最常出现的,几乎所有 C 程序员都出现过的错误就是 段错误 了。也是最难查出问题原因的一个错误。下面我们就针对 段错误 来分析 core 文件的产生、以及我们如何利用 core 文件找到出现崩溃的地方。

何谓 core 文件
       
当一个程序崩溃时,在进程当前工作目录的 core 文件中复制了该进程的存储图像。 core 文件仅仅是一个内存映象 ( 同时加上调试信息 ) ,主要是用来调试的。
当程序接收到以下 UNIX 信号会产生 core 文件:

    在系统默认动作列, 终止 w/core” 表示在进程当前工作目录的 core 文件中复制了该进程的存储图像(该文件名为 core ,由此可以看出这种功能很久之前就是 UNIX 功能的一部分)。大多数 UNIX 调试程序都使用 core 文件以检查进程在终止时的状态。
        core
文件的产生不是 POSIX.1 所属部分 , 而是很多 UNIX 版本的实现特征。 UNIX 6 版没有检查条件 (a) (b) ,并且其源代码中包含如下说明: 如果你正在找寻保护信号,那么当设置 - 用户 -ID 命令执行时,将可能产生大量的这种信号 4.3 + BSD 产生名为 core.prog 的文件,其中 prog 是被执行的程序名的前 1 6 个字符。它对 core 文件给予了某种标识,所以是一种改进特征。


      
表中 硬件故障 对应于实现定义的硬件故障。这些名字中有很多取自 UNIX 早先在 DP-11 上的实现。请查看你所使用的系统的手册,以确切地确定这些信号对应于哪些错误类型。
下面比较详细地说明这些信号。
SIGABRT
调用 abort 函数时产生此信号。进程异常终止。
SIGBUS 
指示一个实现定义的硬件故障。
SIGEMT 
指示一个实现定义的硬件故障。 EMT 这一名字来自 PDP-11 emulator trap 指令。
SIGFPE 
此信号表示一个算术运算异常,例如除以 0 ,浮点溢出等。
SIGILL 
此信号指示进程已执行一条非法硬件指令。
BSD
abort 函数产生此信号。 SIGABRT 现在被用于此。
SIGIOT 
这指示一个实现定义的硬件故障。
IOT
这个名字来自于 PDP-11 对于输入/输出 TRAP(input/output TRAP) 指令的缩写。系统 V 的早期版本,由 abort 函数产生此信号。 SIGABRT 现在被用于此。
SIGQUIT
当用户在终端上按退出键(一般采用 Ctrl-/ )时,产生此信号,并送至前台进 程组中的所有进程。此信号不仅终止前台进程组(如 SIGINT 所做的那样),同时产生一个 core 文件。
SIGSEGV
指示进程进行了一次无效的存储访问。 名字 SEGV 表示 段违例( segmentation violation
SIGSYS 
指示一个无效的系统调用。由于某种未知原因,进程执行了一条系统调用指令, 但其指示系统调用类型的参数却是无效的。
SIGTRAP
指示一个实现定义的硬件故障。 此信号名来自于 PDP-11 TRAP 指令。
SIGXCPU SVR4
4.3+BSD 支持资源限制的概念。如果进程超过了其软 C P U 时间限制,则产生此信号。
SIGXFSZ
如果进程超过了其软文件长度限制,则 SVR4 4.3+BSD 产生此信号。

                                                                           摘自《 UNIX 环境高级编程》第 10 信号
使用 core 文件调试程序
看下面的例子:
/*core_dump_test.c*/
1 #include <stdio.h>
2
3 const char *str = "test";
4
5 void core_test()
6 {
7     str[1] = 'T';
8 }
9
10 int main()
11 {
12     core_test();
13
14     return 0;
15 }
编译:
[zhanghua@localhost core_dump]$ gcc –g core_dump_test.c -o core_dump_test
如果需要调试程序的话,使用 gcc 编译时加上 -g 选项,这样调试 core 文件的时候比较容易找到错误的地方。
执行:
[zhanghua@localhost core_dump]$ ./core_dump_test
段错误
运行 core_dump_test 程序出现了 段错误 ,但没有产生 core 文件。这是因为系统默认 core 文件的大小为 0 ,所以没有创建。可以用 ulimit 命令查看和修改 core 文件的大小。
[zhanghua@localhost core_dump]$ ulimit -c
0
[zhanghua@localhost core_dump]$ ulimit -c 1000
[zhanghua@localhost core_dump]$ ulimit -c
1000
-c
指定修改 core 文件的大小, 1000 指定了 core 文件大小。也可以对 core 文件的大小不做限制,如:
[zhanghua@localhost daemon]# ulimit -c unlimited
[zhanghua@localhost daemon]# ulimit -c
unlimited
如果想让修改永久生效,则需要修改配置文件,如 .bash_profile /etc/profile /etc/security/limits.conf
再次执行:
[zhanghua@localhost core_dump]$ ./core_dump_test
段错误 (core dumped)
[zhanghua@localhost core_dump]$ ls core.*
core.6133
可以看到已经创建了一个 core.6133 的文件 .6133 core_dump_test 程序运行的进程 ID

调式 core 文件
core
文件是个二进制文件,需要用相应的工具来分析程序崩溃时的内存映像。
[zhanghua@localhost core_dump]$ file core.6133
core.6133: ELF 32-bit LSB core file Intel 80386, version 1 (SYSV), SVR4-style, from 'core_dump_test'
Linux 下可以用 GDB 来调试 core 文件。
         GDB
中键入 where ,就会看到程序崩溃时堆栈信息(当前函数之前的所有已调用函数的列表(包括当前函数), gdb 只显示最近几个),我们很容易找到我们的程序在最后崩溃的时候调用了 core_dump_test.c 7 行的代码,导致程序崩溃。注意:在编译程序的时候要加入选项 -g 。您也可以试试其他命令, 如  fram list 等。更详细的用法,请查阅 GDB 文档。

core 文件创建在什么位置

        在进程当前工作目录的下创建。通常与程序在相同的路径下。但如果程序中调用了 chdir 函数,则有可能改变了当前工作目录。这时 core 文件创建在 chdir 指定的路径下。有好多程序崩溃了,我们却找不到 core 文件放在什么位置。和 chdir 函数就有关系。当然程序崩溃了不一定都产生 core 文件。
什么时候不产生 core 文件
在下列条件下不产生 core 文件:
( a )
进程是设置 - 用户 -ID ,而且当前用户并非程序文件的所有者;
( b )
进程是设置 - -ID ,而且当前用户并非该程序文件的组所有者;
( c )
用户没有写当前工作目录的许可权;
( d )
文件太大。 core 文件的许可权 ( 假定该文件在此之前并不存在 ) 通常是用户读 / 写,组读和其他读。

Windows:

Windows下的CoreDump分析和Linux下的基本差不多

1、打开CoreDump功能
使用InstallDriver:/ WINDOWS /System32/drwtsn32.exe进行配置,设置相关的参数。参数的提示都比较清楚就不说明了,在出现CoreDump一般产生两个文件drwtsn32.log和user.dmp。

2、drwtsn32.log
是系统输出的一个文本 文件,会指出出错的指令的地址和当时的堆栈情况。此文件是递增的,每次出现CoreDump的日志会添加在文件的最后。可以使用连接参数/MAP生 成.map文件,根据drwtsn32.log提供的出错信息,在map文件中查找出错的代码,确定出问题的代码。这样做比较麻烦,得自己一点点分析。

3、user.dmp
是个二进制文件。是最 后一次发生CoreDump时的内存影响文件,可以直接在.NET开发环境中直接打开。如故在连接时指出生成调试信息(/DEBUG)可以定位出错的指 令,线程信息,堆栈信息等。使用(/DEBUG)此时输出的文件会大些,没有连接优化了。同时会生成.PDB文件,供调试时使用。注意在打开.dmp文件 的时候,开发环境会验证user.dmp与.pdb文件的一致性,如果不一致将无法装入调试信息。

     通过以上两种方法基本可以确定产生CoreDump的原因。对于 Windows 上产生CoreDump的原因大多是由于一个没有捕获的异常造成。出现这种情况的时候并不一定是由于执行发生异常的那条指令造成的。很可能是由于其他地方的堆的非法访问或者越界的操作操作,影响到了这里。此时查找问题就比较困难了。


 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值