基于VSCode的Linux内核调试环境搭建以及start_kernel跟踪分析

参考ppt的步骤:

准备工作:1-5 ,配置vscode环境:6 ,跟踪分析:7。

目录

1.安装开发工具

 2.下载内核源码

 3.配置内核选项

4.编译和运行内核

5.制作内存根文件系统

*gdb调试(可跳过)

 7.配置VSCode调试Linux内核

 7.跟踪分析


1.安装开发工具

sudo apt install build-essential

sudo apt install qemu # install QEMU#作为一个虚拟机

sudo apt install libncurses5-dev bison flex libssl-dev libelf-dev
#编译内核所需的依赖---一些基础库

 2.下载内核源码

sudo apt install axel

axel -n 20 https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.4.34.tar.xz

#下载源码压缩包

下载出现了“Axel -n 20 :太多重定向”的问题,原因是可能axel版本太低了,还是直接改用了:

​wget https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.4.34.tar.xz

xz -d linux-5.4.34.tar.xz

tar -xvf linux-5.4.34.tar #解压源码

cd linux-5.4.34

 3.配置内核选项

make defconfig # Default configuration is based on 'x86_64_defconfig'
make menuconfig# 打开debug相关选项

打开是这个界面: 

按Enter回车进入“--->”和Space空格键改动“[ ] [*]”来分别进行下面设置:

Kernel hacking  --->
    Compile-time checks and compiler options  --->
        [*] Compile the kernel with debug info
        [*]   Provide GDB scripts for kernel debugging
 [*] Kernel debugging
# 关闭KASLR(随机地址),否则会导致打断点失败。这样调试器就可以跟踪到源代码,之所以设置随机地址为了防止黑客攻击:
Processor type and features ---->
    [ ] Randomize the address of the kernel image (KASLR)

4.编译和运行内核

make -j$(nproc) # nproc gives the number of CPU cores/threads available
# 测试一下内核能不能正常加载运行,因为没有文件系统最终会kernel panic
qemu-system-x86_64 -kernel arch/x86/boot/bzImage

测试了一下出现了Kernel panic: 

5.制作内存根文件系统

        电脑加电启动首先由bootloader加载内核,内核紧接着需要挂载内存根文件系统,其中包含必要的设备驱动和工具,bootloader加载根文件系统到内存中,内核会将其挂载到根目录/下,然后运行根文件系统中init脚本执行一些启动任务,最后才挂载真正的磁盘根文件系统

        我们这里为了简化实验环境,仅制作内存根文件系统。这里借助BusyBox 构建极简内存根文件系统,提供基本的用户态可执行程序

        首先从https://www.busybox.net下载 busybox源代码解压,解压完成后,跟内核一样先配置编译,并安装。 

axel -n 20 https://busybox.net/downloads/busybox-1.31.1.tar.bz2

tar -jxvf busybox-1.31.1.tar.bz2

cd busybox-1.31.1
make menuconfig
#记得要编译成静态链接,不用动态链接库。

 Settings  --->
    [*] Build static binary (no shared libs)静态编译

 然后编译安装,默认会安装到源码目录下的 _install 目录中。

make -j$(nproc) && make install

 然后制作内存根文件系统镜像,大致过程如下:

mkdir rootfs

cd rootfs

cp ../busybox-1.31.1/_install/* ./ -rf

mkdir dev proc sys home

sudo cp -a /dev/{null,console,tty,tty1,tty2,tty3,tty4} dev/

(这里我是返回到linux-5.4.34文件夹下来创建rootfs文件夹的,部分截图:

 接下来准备init脚本文件放在根文件系统跟目录下(rootfs/init),添加如下内容到init文件:(使用touch init 创建init脚本文件,再“vim init”打开init文件,再按i进入插入模式,粘贴进去,再按ESC进入命令模式,:wq保存并退出即可。)

#!/bin/sh
mount -t proc none /proc
mount -t sysfs none /sys
echo "Wellcome YouYouOS!"
echo "--------------------"
cd home
/bin/sh

其中mount命令是对proc和sys进行挂载。

接下来对脚本添加可执行权限:

chmod +x init

 打包成内存根文件系统镜像

find . -print0 | cpio --null -ov --format=newc | gzip -9 > ../rootfs.cpio.gz 

测试挂载根文件系统,看内核启动完成后是否执行init脚本

qemu-system-x86_64 -kernel linux-5.4.34/arch/x86/boot/bzImage -initrd rootfs.cpio.gz 

 这里命令在linux-5.4.34文件夹下执行的,根据我的文件放置位置(我的rootfs.cpio.gz放在了·linux-5.4.34文件里面)改动了:

# 改成了:
qemu-system-x86_64 -kernel ./arch/x86/boot/bzImage -initrd rootfs.cpio.gz

成功执行了init脚本。到这里就可以直接使用gdb调试了。

*gdb调试(可跳过)

执行:

qemu-system-x86_64 -kernel ./arch/x86/boot/bzImage -initrd rootfs.cpio.gz -S -s
#其中-S意思是Stopped,-s为gdb提供一个调试端口tcp:1234。 

 

 同时再打开另一个终端,输入命令:

gdb vmlinux

就可以进行gdb测试跟踪了。

(gdb) target remote:1234   //这是通过之前预留的tcp:1234建立连接
(gdb) b start_kernel            //这是设置了第一个断点
c、bt、list、next、step....  //具体查看gdb的命令

 测试的时候gdb出现了Remote 'g' packet reply is too long的问题:参考了下面的文章:

解决Remote 'g' packet reply is too long错误

但是命令行下打断点跟踪代码还是不够方便,用VSCode边看代码随时打断点单步执行会更方便一些。使用vscode还需要再配置下vscode的环境。

 6.配置VSCode调试Linux内核

        首先在linux系统下载vscode安装包,打开ubuntu自带的火狐浏览器下载:官方下载地址,选择.deb下载选项,这里我下载的是:

 

然后执行安装命令 sudo apt install ./<filename>.deb,我的文件对应的安装命令是:

sudo apt install ./code_1.76.1-1678294265_amd64.deb

        还要安装VSCode插件C/C++ Intellisense和C/C++ Themes。由于插件C/C++ Intellisense需要GNU Global,还需要使用如下命令安装GNU Global。

sudo apt install global

 接下来在VScode里搜索安装这几个扩展(中文可以不用):

准备在vscode中打开前面准备好的linux-5.4.34文件夹,需要做两件事情:

(1)命令行输入:

python ./scripts/gen_compile_commands.py

(不然后面配置文件这里会报错:)

 

 这里的解释是:由于 Linux 内核高度定制化,所以没有办法直接通过配置 includePath 等让 Intellisense 正常提示,这里借助一个 Python 脚本来生成 compile_commands.json 文件帮助 Intellisense 正常提示(包括头文件和宏定义等)。在Linux源代码目录下直接运行如下命令就可以生成 compile_commands.json 了。                                                   ----来自老师的ppt

(2)需要在linux-5.4.34文件夹下在此之前直接先手动放好配置文件:新建一个.vscode文件夹,(需要点击ctrl+h显示隐藏文件)把配置文件里的文件全部放入.vscode文件夹内:

 接下来就可以在vscode里打开linux-5.4.34文件夹:可以看到.vscode配置文件夹已经出现了:

 同时改一下tasks.json:跟前面文件放置的问题一致。(我的文件放置是这样改)

 还有setting.json里最后这个"Disabled"按照我的vscode提示改成了"disabled"(可能版本问题?)

 

 这下vscode的调试环境就配置好了。

(如果更改文件则需要再在命令行make -j$(nproc) 一下)

 7.跟踪分析

因为linux内核的起点是"start_kernel"函数,因此先在start_kernel处打断点:点击运行和调试图标,在断点里增加函数断点:start_kernel

点击运行--启动调试,从start_kernel开始进行跟踪分析。

 可以看到程序执行停在了start_kernel处:

点击单点跳过,这里我们看到了0号进程init_task被设置整个系统的第一个进程(0进程是手工创建的,其他进程都是0号进程创建的)在内核引导时,init_task会被创建并启动,它是所有其他进程的起点。

继续跳过,start_kernel会继续执行一些初始化操作,包括初始化各种重要的数据结构、驱动程序、中断处理程序等。在这个阶段,内核会建立好一些必要的核心数据结构,如物理内存管理器、虚拟内存管理器,以及进程调度器等。

 最后来到start_kernel的结尾arch_call_reset_init(),这个点开这个函数的定义是执行了reset_init()函数,因此我们再设置一个函数断点"reset_init",继续点击单点跳过发现就进入了reset_init函数内部。这个函数是由0号进程执行的。

 

 

 继续执行,这时候遇到了kernel_init,即1号进程,它是所有用户进程的祖先,由kernel_thread函数创建,kernel_thread函数创建一个新的内核线程(实际linux不支持线程所以是一个内核进程),该线程的入口地址是kernel_init()函数。

点开kernel_thread函数的定义。

发现kernel_thread函数是通过_do_fork函数来创建进程的。

 _do_fork函数主要完成了调用copy_process()复制父进程、调用wake_up_new_task将子进程加入就绪队列等待调度执行等。

这里copy_process点进去还有调用dup_task_struct函数等过程,放上do_fork的过程,借用老师ppt的图一目了然:

接下来在新线程(进程)中运行kernel_init()函数, 点开kernel_init()函数,可以看出,在这个里面调用了run_init_process函数:

 一共有三个if,其中前两个点开ramdisk_execute_command和execute_command的定义看程序没有看懂,因此这里参考了一篇文章【linux kernel】linux内核的init线程

ramdisk_execute_command 可以通过 uboot 在环境变量中指定。execute_command也是一个全局的 char 指针变量,值也可以通过u-boot 传递。

 所以这两个没有值就按顺序再尝试跳转到/sbin/init、/etc/init、/bin/init、/bin/sh去启动用户空间的init程序。而run_init_process函数则使用了do_execve函数:

 点开do_execve函数,do_execve加载可执行文件,运行init程序,执行exec系统调用,

-> do_execve() –> do_execveat_common() -> __do_execve_file -> exec_binprm()-> search_binary_handler() -> load_elf_binary() -> start_thread()。

 这样1号进程就完成了用户态初始化。

接下来是2号进程的创建,2号进程是所有内核进程的祖先,kernel_thread创建了2号进程,同时进程执行的函数是kthreadd:

查看kthreadd函数,做完一些初始化设置后,发现2号进程在不停地查看是否有需要创建的内核进程,如果kthread_create_list不空即有需要创建的内核进程,则就创建否则就执行schedule函数(不创建?)

 reset_init函数继续执行,最后调用了cpu_startup_entry,设置断点查看这个函数,发现它最后执行了while(1)无限循环,循环内执行do_idle函数,这个函数具体查看了这个帖子:idle进程内的do_idle函数的作用,总结就是:

在do_idle()中,代码会不断地轮询,判断当前系统是否需要调度,如果系统当前不需要调度,则进入到idle状态。 

 这样循环的意义就是:

根据内核源码——C语言阶段的start_kernel函数_天糊土的博客-CSDN博客

 总结:

调度系统负责考评系统中所有的进程。只要有哪个需要被运行,调度系统就会终止cpu_idle死循环进程(空闲进程)转而去执行有意义的干活的进程。 

 这样start_kernel就简单分析完了。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 12
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值