1.安装开发工具
本次实验采用的环境是ubuntu22.04,但是事实上22版会出现很多问题,经过同学们的商量改为18版
首先下载一些工具:
sudo apt install build-essential
sudo apt install qemu # install QEMU#作为一个虚拟机
sudo apt install libncurses5-dev bison flex libssl-dev libelf-dev
2.下载内核源码
sudo apt install axel
axel -n 20 https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.4.34.tar.xz
#下载源码压缩包
xz -d linux-5.4.34.tar.xz
tar -xvf linux-5.4.34.tar #解压源码
cd linux-5.4.34
3.配置内核选项
这里不能用老师的方式去配置,需要修改
make defconfig # Default configuration is based on 'x86_64_defconfig'
make menuconfig# 打开debug相关选项
修改里面的如下配置:
Kernel hacking --->
Compile-time checks and compiler options --->
[*] Compile the kernel with debug info
[*] Provide GDB scripts for kernel debugging
[*] Kernel debugging
# 关闭KASLR(随机地址),否则会导致打断点失败。这样调试器就可以跟踪到源代码,之所以设置随机地址为了防止黑客攻击:
Processor type and features ---->
[ ] Randomize the address of the kernel image (KASLR)
4.编译和运行内核
make -j$(nproc) # nproc gives the number of CPU cores/threads available
# 测试一下内核能不能正常加载运行,因为没有文件系统最终会kernel panic
qemu-system-x86_64 -kernel arch/x86/boot/bzImage
编译成功
5.制作根文件系统
首先从https://www.busybox.net下载 busybox源代码解压,解压完成后,跟内核一样先配置编译,并安装。
如果直接采用老师的方式会报错,这里可以采用打补丁的方式:[busybox编译报错undefined reference to `stime‘ make: *** Makefile:716: busybox_unstripped] Error 1_o_alpha的博客-CSDN博客
打个补丁即可,这里采用的是下载下一个版本代替,这样更简单一点,操作如下:
axel -n 20 https://busybox.net/downloads/busybox-1.32.0.tar.bz2 #这里从31.1改为32.0
tar -jxvf busybox-1.32.0.tar.bz2
cd busybox-1.32.0
编译运行:
make menuconfig
#记得要编译成静态链接,不用动态链接库。
然后编译安装即可:
make -j$(nproc) && make install
然后利用busybox制作根文件目录:
mkdir rootfs
cd rootfs
cp ../busybox-1.32.0/_install/* ./ -rf
mkdir dev proc sys home
sudo cp -a /dev/{null,console,tty,tty1,tty2,tty3,tty4} dev/
然后还需要创建一个init文件。内容如下:
#!/bin/sh
mount -t proc none /proc
mount -t sysfs none /sys
echo "Welcome YouYouOS!"
echo "--------------------"
cd home
/bin/sh
接下来对脚本添加可执行权限然后将根目录文件打包:
chmod +x init
find . -print0 | cpio --null -ov --format=newc | gzip -9 > ../rootfs.cpio.gz
运行一下:
qemu-system-x86_64 -kernel ./arch/x86/boot/bzImage -initrd rootfs.cpio.gz
6.gdb调试
执行:
qemu-system-x86_64 -kernel ./arch/x86/boot/bzImage -initrd rootfs.cpio.gz -S -s
#其中-S意思是Stopped,-s为gdb提供一个调试端口tcp:1234。
在打开另一个终端:
gdb vmlinux
然后就可以进行gdb调试了
(gdb) target remote:1234 //这是通过之前预留的tcp:1234建立连接
(gdb) b start_kernel //这是设置了第一个断点
c
7.配置vscode调试linux内核
在官网安装vscode之后,需要安装以下:
sudo apt install global
安装扩展:c++和GDB Debug
在内核文件处命令行输入:
python ./scripts/gen_compile_commands.py
还需要创建一个.vscode的配置文件,里面放入这个网址上的配置文件:
https://github.com/mengning/linuxkernel/tree/master/src/kerneldebuging
其中这个地方根据你把文件放的位置来决定,如果是执行的之前的命令的话是应该在内核文件目录下的
8. 跟踪调试
因为linux内核的起点是"start_kernel"函数,因此先在start_kernel处打断点:点击运行和调试图标,在断点里增加函数断点:start_kernel
结果出现bug了:
这里实在是不知道啥bug,一直在执行,但不出结果,但gdb调试既然没错的话,大概率是vscode的插件问题,我换了几个版本居然是时好时不好(薛定谔的bug)。
最后的解决方式:
在终端执行qemu之后,再在vscode里面打断点运行(取巧了)
这里我们看到了0号进程init_task被设置整个系统的第一个进程(0进程是手工创建的,其他进程都是0号进程创建的)在内核引导时,init_task会被创建并启动,它是所有其他进程的起点。
继续跳过,start_kernel会继续执行一些初始化操作,包括初始化各种重要的数据结构、驱动程序、中断处理程序等。在这个阶段,内核会建立好一些必要的核心数据结构,如物理内存管理器、虚拟内存管理器,以及进程调度器等。
最后是start_kernel的结尾arch_call_reset_init(),这个点开这个函数的定义是执行了reset_init()函数,进入reset_init函数内部。这个函数是由0号进程执行的。
进入函数之后看到了kernel_init,即1号进程,它是所有用户进程的祖先,由kernel_thread函数创建,kernel_thread函数创建一个新的内核线程(实际linux不支持线程所以是一个内核进程),该线程的入口地址是kernel_init()函数。
接下来是2号进程的创建,2号进程是所有内核进程的祖先,kernel_thread创建了2号进程,同时进程执行的函数是kthreadd: