简介
内核的调试有很多的手段,有些复杂的手段可以为开发者提供详细的信息来找出问题以及作相应优化,有些手段很简单,但也能够有效定位问题,关键看需求和精力,如果长期做相关的工作,去花时间掌握这些技能是有必要的。最简单的内核调试方法莫过于printk,我们可以通过使用宏对其进行包装,以达到在调试时输出提示信息,使用时不输出提示信息的目的,甚至可以设置不同的提示等级。但是有些严重的错误会导致内核直接崩溃,无法输出任何提示信息,这时kdump就派上用场了。
在分析操作系统crash的原因时,需要用到kernel dump。Linux系统用来捕捉kernel dump的工具是kdump(用来分析dump文件的工具则是crash)。
其基本原理是准备了一个小的“第二内核”(dump-capture kernel),在原来的内核崩溃后,它开始工作,将系统内存里的数据写入dump文件,之后reboot。
kdump的工作过程如下:
- 系统内核启动的时候,会给dump-capture kernel预留一块内存空间;
- 内核启动完成后,kdump service执行 kexec -p 命令把dump-capture kernel载入预留的内存里;
- 然后,如果系统发生crash,会自动reboot进入dump-capture kernel,dump-capture,kernel只使用自己的预留内存,确保其余的内存数据不会被改动,它的任务是把系统内存里的数据写入到dump文件(/var/crash/目录下,一般以时间戳命名)
- dump文件写完之后,dump-capture kernel自动reboot
其详细的原理大家可以查阅相关的资料,这里只是使用它,所以知道上面的内容足够。
安装教程
安装
在ubuntu下实现Kdump只需要安装linux-crashdump这个包就可以了:
sudo apt-get install lin