linux内核的oops信息
Oops可看成是内核级(特权级)的Segmentation Fault。一般应用程序(用户级)如进行了内存的非法访问(地址不合法、无权限访问、……)或执行了非法指令,则会得到Segfault信号,一般对应的行为是coredump,应用程序也可以自行获取Segfault信号进行处理,而内核出错则是打印出Oops信息。
内核打印Oops信息的执行流程:
1、do_page_fault()(arch/i386/mm/fault.c),如果内核出现非法访问,则该函数会打印出EIP、PDE等信息,如下:
Unable to handle kernel paging request at virtual address f899b670
printing eip:
c01de48c
*pde = 00737067
接下来调用die("Oops", regs, error_code);函数,此时如果系统还活着(至少要满足两个条件:1. 在进程上下文 2. 没有设置panic_on_oops),则会kill掉当前进程,以致死机。
2、die()(arch/i386/kernel/traps.c),该函数最开始会打印出:
Oops: 0002 [#1]
其中,0002代表错误码,#1代表Oops发生次数。
error_code:
* bit0
0 means no page found, 1 means protection fault
* bit1
0 means read, 1 means write
* bit2
0 means kernel, 1 means user-mode
* bit3
0 means data,1 means instruction
接下来会调用 show_registers(regs) 函数,输出寄存器、当前进程、堆栈、指令代码等信息,以供判断。
Linux内核在发生kernel panic时会打印出Oops信息,把当前的寄存器状态、堆栈信息、完整的Call trace都打印出来,以帮助我们定位错误。下在是一个例子,该例子展示了空指针引用错误。
01
#include <linux/kernel.h>
02
#include <linux/module.h>
03
04
static int __init hello_init(void)
05
{
06
int *p = 0;
07
08
*p = 1;
09
return