一文搞懂Linux内核initrd和Debian实例

init/main.c中的start_kernel函数完成了所有的全局特性初始化,这些全局特性包括内核运转所需要的基础设施,比如虚拟内存设施,进程调度设施,中断设施,缓存设施,VFS设施等,接下来启动1号进程的内核部分,在start_kernel的最后rest_init函数中启动之:

static void noinline rest_init(void)
{
    kernel_thread(init, NULL, CLONE_FS | CLONE_SIGHAND);
    numa_default_policy();
    unlock_kernel();
     cpu_idle();
}

因此init/main.c中的init内核线程函数即是1号进程的内核部分,它完成内核的另一部分初始化之后即exec到1号进程的用户态,从此一直到关机或者重启,不再返回内核态,实际上exec本质上替换了进程地址空间,也就无从返回了。

init函数主要进行另一部分的初始化,涉及驱动,网络协议栈,以及为1号进程用户态即init进程准备环境,其中最为重要的就是populate_rootfs函数,在启动initrd的情况下,最为重要的是它将initrd的内存写到了一个文件当中或者直接将initrd的内容写到整个rootfs:

1.将内容写到文件:

fd = sys_open("/initrd.image", O_WRONLY|O_CREAT, 700);
if (fd >= 0) {
    sys_write(fd, (char *)initrd_start, initrd_end - initrd_start); //将initrd的内容写入文件
    sys_close(fd);
    free_initrd_mem(initrd_start, initrd_end); //释放initrd原始内容所占用的内存
}

2.将内容直接放到rootfs:根据rootfs和initrd的内存地址信息直接写。

可见sys_open调用创建了一个文件,即/initrd.image,它的内容就是initrd内存盘的内容,可是它在/下被创建,在linux中,所有的文件都要有一个“文件系统”作为载体,这个/目录所在的文件系统是什么呢?其实是一个内存盘,在start_kernel中的vfs_caches_init负责初始化文件系统,也就是VFS,这是一个虚拟文件系统的框架,其实现如下:

void __init vfs_caches_init(unsigned long mempages)
{
    unsigned long reserve;

    /* Base hash sizes on available memory, with a reserve equal to
           150% of current kernel size */

    reserve = min((mempages - nr_free_pages()) * 3/2, mempages - 1);
    mempages -= reserve;

    names_cachep = kmem_cache_create("names_cache", PATH_MAX, 0,
            SLAB_HWCACHE_ALIGN|SLAB_PANIC, NULL, NULL);
    filp_cachep = kmem_cache_create("filp", sizeof(struct file), 0,
            SLAB_HWCACHE_ALIGN|SLAB_PANIC, filp_ctor, filp_dtor);
    dcache_init(mempages);
    inode_init(mempages);
    files_init(mempages);
    mnt_init(mempages);
    bdev_cache_init();
    chrdev_init();
}
在mnt_init中初始化了一个rootfs:
int __init init_rootfs(void)
{
    return register_filesystem(&rootfs_fs_type);
}

在mnt_init中初始化了一个rootfs:

int __init init_rootfs(void)
{
    return register_filesystem(&rootfs_fs_type);
}

然后在init_mount_tree中调用do_kern_mount挂载了这个rootfs作为“根”,接下来在init函数中创建/initrd.image就有所依托了,它就是在rootfs中创建了一个文件:/initrd.image,rootfs本质上是一个内存文件系统,因为此时还没有加载任何驱动,更别说磁盘,磁带,网卡驱动了,因此文件系统也只能是内存式的。linux的vfs功能十分强大,以文件作为接口使初始化过程如此简洁!

接下来就要加载驱动了,do_basic_setup初始化了所有硬编译进内核的驱动,然而驱动并不一定要编译进内核,而这些驱动可能对于加载基于磁盘的根文件系统还至关重要,比如ide驱动,比如scsi驱动等,这些就由initrd来加载了,initrd的本质是一只鸡,也就是在有磁盘根文件系统这个“蛋”之前先要有一只“鸡”。

接下来prepare_namespace登场,我们可以看到在populate_rootfs结束后分开了两条线索:

if (sys_access((const char __user *) "/init", 0) == 0)
    execute_command = "/init";
else
    prepare_namespace();

然后在init_mount_tree中调用do_kern_mount挂载了这个rootfs作为“根”,接下来在init函数中创建/initrd.image就有所依托了,它就是在rootfs中创建了一个文件:/initrd.image,rootfs本质上是一个内存文件系统,因为此时还没有加载任何驱动,更别说磁盘,磁带,网卡驱动了,因此文件系统也只能是内存式的。linux的vfs功能十分强大,以文件作为接口使初始化过程如此简洁!

接下来就要加载驱动了,do_basic_setup初始化了所有硬编译进内核的驱动,然而驱动并不一定要编译进内核,而这些驱动可能对于加载基于磁盘的根文件系统还至关重要,比如ide驱动,比如scsi驱动等,这些就由initrd来加载了,initrd的本质是一只鸡,也就是在有磁盘根文件系统这个“蛋”之前先要有一只“鸡”。

接下来prepare_namespace登场,我们可以看到在populate_rootfs结束后分开了两条线索:

if (sys_access((const char __user *) "/init", 0) == 0)
    execute_command = "/init";
else
    prepare_namespace();

如果initrd的内容被直接写到了rootfs,那么在rootfs的/目录中会有一个init程序,它可以是ELF程序,也可以是脚本,这是因为linux_binprm这个基础设施已经初始化过了。如果/下有init的话,那么这肯定就是cpio格式的initrd,反之则是image的,这一切都是在populate_rootfs中判断的,如果是cpio格式的,那么可以看到,全局变量execute_command被赋值为/init,然后直接执行。

这样就完事了,cpio格式的initrd的/下有一个init程序,它一旦执行就使用exec进入了用户态,再也无法返回内核,最终自己将“真正的根文件系统”挂载,至于谁是真正的根,它需要命令行参数信息,这个信息是通过/proc文件系统得到的,由于内核并不处理挂载procfs的信息,这个proc文件系统需要initrd的/init程序自己挂载。而如果populate_rootfs判断不是cpio格式的,那么就会仅在/下建立一个/initrd.image文件,当然不会有/init存在了,于是就进入了prepare_namespace:

void __init prepare_namespace(void)
{
...
    if (saved_root_name[0]) {  //设置root文件系统的命令行参数,比如root=/dev/hda1
        root_device_name = saved_root_name;
        ROOT_DEV = name_to_dev_t(root_device_name); //设置ROOT_DEV
        if (strncmp(root_device_name, "/dev/", 5) == 0)
            root_device_name += 5;
    }
...
    if (initrd_load())
        goto out;
...
}
void __init prepare_namespace(void)
{
...
    if (saved_root_name[0]) {  //设置root文件系统的命令行参数,比如root=/dev/hda1
        root_device_name = saved_root_name;
        ROOT_DEV = name_to_dev_t(root_device_name); //设置ROOT_DEV
        if (strncmp(root_device_name, "/dev/", 5) == 0)
            root_device_name += 5;
    }
...
    if (initrd_load())
        goto out;
...
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

简说Linux内核

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值