一、Linux内核源代码简介
1.三大法宝:存储程序计算机、函数调用堆栈、中断。
2.“两把宝剑”:中断上下文、进程上下文
3.Linux内核代码目录结构分析:
arch:arch目录是与体系结构相关的子目录列表,里面存放了许多CPU体系结构的相关代码,比如arm、x86、MIPS、PPC等。
block:存放Linux存储体系中关于块设备管理的代码。
crypto:存放常见的加密算法的C语言代码,譬如crc32、md5、sha1等。
Documentation:存放一些文档。
drivers:驱动目录,里面分门别类地存放了Linux内核支持的所有硬件设备的驱动代码。
fs:文件系统,里面列出了Linux支持的各种文件系统的实现。
init:init是初始化的意思,存放Linux内核启动时的初始化代码。
我们可以在main.c中找到start_kernel函数,start_kernel函数是初始化Linux内核启动的起点,start_kernel前的代码使用汇编语言来进行硬件初始化。
二、构造一个简单的Linux内核
1.在实验楼平台上构建Linux系统MenuOS:
命令分析
cd ~/LinuxKernel/
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img
//qemu仿真kernel;bzImage是vmLinux经过gzip压缩后的文件,是压缩的内核映像,"b"代表的是"big"(bzImage适用于大内核,zImage适用于小内核)。
2.gdb跟踪调试Linux内核
命令分析
$ qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S
/* 关于-s和-S选项的说明:
1. -S
-S freeze CPU at startup (use ’c’ to start execution)
2. -s
-s shorthand for -gdb tcp::1234
若不想使用1234端口,则可以使用-gdb tcp:xxxx来取代-s选项 */
// 打开 GDB 调试器
gdb
// 在 GDB 中输入以下命令:
// 在gdb界面中targe remote之前加载符号表
(gdb)file linux-3.18.6/vmlinux
// 建立gdb和gdbserver之间的连接,按c 让qemu上的Linux继续运行
(gdb)target remote:1234
// 断点的设置可以在target remote之前,也可以在之后
(gdb)break start_kernel
// 查看断点处的start_kernel()函数
(gdb)list
三、实验分析
1.start_kernel()
对于这个简单的Linux内核来说,start_kernel() 相当于是C中的main函数,是内核运行的起点,在此函数被调用之前内核代码是用汇编语言写的,完成系统的初始化工作,为c代码的运行设置环境。
2.init_task()
start_kernel() 函数几乎涉及到了内核的所有模块,如:trap_init()(中断向量的初始化)、mm_init()(内存管理的初始化)sched_init()(调度模块的初始化)等,首先是510行的init_task():
struct task_struct init_task = INIT_TASK(init_task);
可以看出 init_task(0号进程)是 task_struct 类型,是进程描述符,使用宏INIT_TASK对其进行初始化。接下来就是对各种模块的初始化,包括像trap_init、buffer_init、key_init。
3.rest_init()
kernel_thread()是 fork 出了一个新进程来执行kernel_init 函数,而 init_task 是使用宏进行初始化的。也就是说0进程不是系统通过 kernel_thread 的方式(也就是 fork)创建的(init_task 是唯一一个没有通过 fork()产生的进程)。