朱婷婷 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
一、linux内核代码结构组成
这里稍微说一下孟宁老师在课程里提到的几个重要的文件目录
首先说下/arch这个目录,这个目录的内容相当庞大,可移植性使得内核可以工作在各种处理器和系统上。一些内核支持的处理器的型号包括:Alpha、AMD、ARM、C6X、Intel、x86、Microblaze、MIPS、PowerPC、SPARC、UltraSPARC等, 这里所做的实验是关于x86系统的
/Documentation - 此文件夹包含了内核信息和其他许多文件信息的文本文档
/drivers - 该目录包含了驱动代码。驱动是一个控制硬件的软件
/fs 是文件系统相关的代码
/init 内核启动的相关代码都在这个目录下
/ipc 进程间通信的目录
/kernel 这个文件夹中的代码控制内核本身。例如,如果一个调试器需要跟踪问题,内核将使用这个文件夹中代码来将内核指令通知调试器跟踪内核进行的所有动作。这里也有跟踪时间的代码。在内核文件夹下有个"power"文件夹,这里的代码可以使计算机重新启动、关机和挂起。
/mm内存管理的代码
/net 和网络相关的代码
其他目录的介绍请参考http://blog.csdn.net/ffmxnjm/article/details/72933915
二、start_kernel的启动过程
1. 启动过程的概述(来自课程的参考资料)
x86 cpu 启动的第一个动作cs:eip = ffff:0000h(换算为物理地址为000ffff0h,因为16位CPU有20根地址线),即BIOS程序的位置
BIOS例行程序检测完硬件并完成相应的初始化之后就会寻找可引导介质, 找到后把引导程序加载到指定内存区域后,就把控制权交给引导程序。这里一般是把硬盘的第一个扇区MBR和活动分区的引导程序加载到内存(即加载到BootLoader),加载完整后把控制权交给BootLoader
引导程序BootLoader开始负责操作系统的初始化,然后启动操作系统。启动操作系统时一般会指定kernel、initrd 和root所在的分区和目录,比如root(hd0,0), kernel(hd0,0)/bzImage root=/dev/ram init=/bin/ash, initrd(hd0,0)/myinitrd4M.img
内核启动过程包括start_kernel之前和之后, 之前全部是做初始化的汇编指令,之后开始C代码的操作系统初始化,最后执行第一个用户态进程init
一般分两个阶段启动,先是利用initrd的内存文件系统,然后切换到硬盘文件系统继续启动。initrd 文件的功能主要有两个:1.提供开机必须的单kernel文件(即vmlinuz)没有提供的驱动模块2.负责加载硬盘上的根文件系统并执行其中的/sbin/init
下面我们来看一下/init/main.c中start_kernel的代码,这是内核启动的起点,不管分析内核的那个部分都需要从start_kernel开始
asmlinkage __visible void __init start_kernel(void)
{
char *command_line;
char *after_dashes;
/*
* Need to run as early as possible, to initialize the
* lockdep hash:
*/
lockdep_init();
set_task_stack_end_magic(&init_task);
smp_setup_processor_id();
debug_objects_early_init();
/*
* Set up the the initial canary ASAP:
*/
boot_init_stack_canary();
cgroup_init_early();
local_irq_disable();
early_boot_irqs_disabled = true;
/*
* Interrupts are still disabled. Do necessary setups, then
* enable them
*/
boot_cpu_init();
page_address_init();
pr_notice("%s", linux_banner);
setup_arch(&command_line);
mm_init_cpumask(&init_mm);
setup_command_line(command_line);
setup_nr_cpu_ids();
setup_per_cpu_areas();
smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
build_all_zonelists(NULL, NULL);
page_alloc_init();
pr_notice("Kernel command line: %s\n", boot_command_line);
parse_early_param();
after_dashes = parse_args("Booting kernel",
static_command_line, __start___param,
__stop___param - __start___param,
-1, -1, &unknown_bootoption);
if (!IS_ERR_OR_NULL(after_dashes))
parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
set_init_arg);
jump_label_init();
/*
* These use large bootmem allocations and must precede
* kmem_cache_init()
*/
setup_log_buf(0);
pidhash_init();
vfs_caches_init_early();
sort_main_extable();
trap_init();
mm_init();
/*
* Set up the scheduler prior starting any interrupts (such as the
* timer interrupt). Full topology setup happens at smp_init()
* time - but meanwhile we still have a functioning scheduler.
*/
sched_init();
/*
* Disable preemption - early bootup scheduling is extremely
* fragile until we cpu_idle() for the first time.
*/
preempt_disable();
if (WARN(!irqs_disabled(),
"Interrupts were enabled *very* early, fixing it\n"))
local_irq_disable();
idr_init_cache();
rcu_init();
context_tracking_init();
radix_tree_init();
/* init some links before init_ISA_irqs() */
early_irq_init();
init_IRQ();
tick_init();
rcu_init_nohz();
init_timers();
hrtimers_init();
softirq_init();
timekeeping_init();
time_init();
sched_clock_postinit();
perf_event_init();
profile_init();
call_function_init();
WARN(!irqs_disabled(), "Interrupts were enabled early\n");
early_boot_irqs_disabled = false;
local_irq_enable();
kmem_cache_init_late();
/*
* HACK ALERT! This is early. We're enabling the console before
* we've done PCI setups etc, and console_init() must be aware of
* this. But we do want output early, in case something goes wrong.
*/
console_init();
if (panic_later)
panic("Too many boot %s vars at `%s'", panic_later,
panic_param);
lockdep_info();
/*
* Need to run this when irqs are enabled, because it wants
* to self-test [hard/soft]-irqs on/off lock inversion bugs
* too:
*/
locking_selftest();
#ifdef CONFIG_BLK_DEV_INITRD
if (initrd_start && !initrd_below_start_ok &&
page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {
pr_crit("initrd overwritten (0x%08lx < 0x%08lx) - disabling it.\n",
page_to_pfn(virt_to_page((void *)initrd_start)),
min_low_pfn);
initrd_start = 0;
}
#endif
page_cgroup_init();
debug_objects_mem_init();
kmemleak_init();
setup_per_cpu_pageset();
numa_policy_init();
if (late_time_init)
late_time_init();
sched_clock_init();
calibrate_delay();
pidmap_init();
anon_vma_init();
acpi_early_init();
#ifdef CONFIG_X86
if (efi_enabled(EFI_RUNTIME_SERVICES))
efi_enter_virtual_mode();
#endif
#ifdef CONFIG_X86_ESPFIX64
/* Should be run before the first non-init thread is created */
init_espfix_bsp();
#endif
thread_info_cache_init();
cred_init();
fork_init(totalram_pages);
proc_caches_init();
buffer_init();
key_init();
security_init();
dbg_late_init();
vfs_caches_init(totalram_pages);
signals_init();
/* rootfs populating might need page-writeback */
page_writeback_init();
proc_root_init();
cgroup_init();
cpuset_init();
taskstats_init_early();
delayacct_init();
check_bugs();
sfi_init_late();
if (efi_enabled(EFI_RUNTIME_SERVICES)) {
efi_late_init();
efi_free_boot_services();
}
ftrace_init();
/* Do the rest non-__init'ed, we're now alive */
rest_init();
}
其中
set_task_stack_end_magic(&init_task);
这里有一个全局变量init_task, 0号进程的一些初始化在这个地方进行的,init_task是在/init/init_task.c中被定义的,struct task_struct init_task = INIT_TASK(init_task);这里还有一个trapinit();这个后续要学的中断相关。还有一些内存管理的初始化,调度的初始化等等。这里我们最关心的还有一个rest_init();
在rest_init()中调用了kernel_thread(kernel_init, NULL, CLONE_FS); 这里kernel_init()函数里面调用了run_init_process(ramdisk_execute_command);这个函数创建了第一个用户进程,也就是1号进程。接下来又调用了kernel_thread()创建内核线程,来管理内核资源。最后调用了cpu_startup_entry(CPUHP_ONLINE);在这个函数里调用了cpu_idle_loop();这个函数是0号进程一直在while(1)这样一个死循环里面。 总的来说,rest_init()是从start_kernel 开始就一直运行,0号进程一直存在。整个内核的启动过程可以归纳为从BIOS-->bootloader-->idle,0号进程一直处于内核太,1号进程,即init进程是所有用户进程的祖先。init进程是linux系统内核初始化与用户态初始化的接合点。
三、实验截图