Linux 内核启动分析
1. 内核启动地址
1.1. 名词解释
ZTEXTADDR
解压代码运行的开始地址。没有物理地址和虚拟地址之分,因为此时MMU处于关闭状态。这个地址不一定时RAM的地址,可以是支持读写寻址的flash等存储中介。
Start address of decompressor. here's no point in talking about virtual or physical addresses here, since the MMU will be off at the time when you call the decompressor code. You normally call the kernel at this address to start it booting. This doesn't have to be located in RAM, it can be in flash or other read-only or read-write addressable medium.
ZRELADDR
内核启动在RAM中的地址。压缩的内核映像被解压到这个地址,然后执行。
This is the address where the decompressed kernel will be written, and eventually executed. The following constraint must be valid:
__virt_to_phys(TEXTADDR) == ZRELADDR
The initial part of the kernel is carefully coded to be position independent.
TEXTADDR
内核启动的虚拟地址,与ZRELADDR相对应。一般内核启动的虚拟地址为RAM的第一个bank地址加上0x8000。
TEXTADDR = PAGE_OFFSET + TEXTOFFST
Virtual start address of kernel, normally PAGE_OFFSET + 0x8000.This is where the kernel image ends up. With the latest kernels, it must be located at 32768 bytes into a 128MB region. Previous kernels placed a restriction of 256MB here.
TEXTOFFSET
内核偏移地址。在arch/arm/makefile中设定。
PHYS_OFFSET
RAM第一个bank的物理起始地址。
Physical start address of the first bank of RAM.
PAGE_OFFSET
RAM第一个bank的虚拟起始地址。
Virtual start address of the first bank of RAM. During the kernel
boot phase, virtual address PAGE_OFFSET will be mapped to physical
address PHYS_OFFSET, along with any other mappings you supply.
This should be the same value as TASK_SIZE.
1.2. 内核启动地址确定
内核启动引导地址由bootp.lds决定。 Bootp.lds : arch/arm/bootp
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = 0;
.text : {
_stext = .;
*(.start)
*(.text)
initrd_size = initrd_end - initrd_start;
_etext = .;
}
}
由上 .= 0可以确定解压代码运行的开始地址在0x0的位置。ZTEXTADDR的值决定了这个值得选取。
Makefile : arch/arm/boot/compressed
如果设定内核从ROM中启动的话,可以在make menuconfig 的配置界面中设置解压代码的起始地址,否则解压代码的起始地址为0x0。实际上,默认从ROM启动时,解压代码的起始地址也是0x0。
feq ($(CONFIG_ZBOOT_ROM),y)
ZTEXTADDR := $(CONFIG_ZBOOT_ROM_TEXT)
ZBSSADDR := $(CONFIG_ZBOOT_ROM_BSS)
else
ZTEXTADDR :=0 ZBSSADDR := ALIGN(4)
endif
SEDFLAGS = s/TEXT_START/$(ZTEXTADDR)/;s/BSS_START/$(ZBSSADDR)/
……
$(obj)/vmlinux.lds: $(obj)/vmlinux.lds.in arch/arm/mach-s3c2410/Makefile .config
@sed "$(SEDFLAGS)" < $< > $@
@sed "$(SEDFLAGS)" < $< > $@ 规则将TEXT_START设定为ZTEXTADDR。TEXT_START在arch/arm/boot/compressed /vmlinux.lds.in 中被用来设定解压代码的起始地址。
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = TEXT_START;
_text = .;
.text : {
_start = .;
*(.start)
*(.text)
*(.text.*)
……
}
}
内核的编译依靠vmlinux.lds,vmlinux.lds由vmlinux.lds.s 生成。从下面代码可以看出内核启动的虚拟地址被设置为PAGE_OFFSET + TEXT_OFFSET,而内核启动的物理地址ZRELADDR在arch/arm/boot/Makefile中设定。
OUTPUT_ARCH(arm)
ENTRY(stext)
SECTIONS
{
#ifdef CONFIG_XIP_KERNEL
. = XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR);
#else
. = PAGE_OFFSET + TEXT_OFFSET;
#endif
.init : { /* Init code and data */
_stext = .;
_sinittext = .;
*(.init.text)
_einittext = .;
……
}
}
# arch/arm/boot/Makefile
# Note: the following conditions must always be true:
# ZRELADDR == virt_to_phys(PAGE_OFFSET + TEXT_OFFSET)
# PARAMS_PHYS must be within 4MB of ZRELADDR
# INITRD_PHYS must be in RAM
ZRELADDR := $(zreladdr-y)
#---> zrealaddr-y is specified with 0x30008000 in arch/arm/boot/makefile.boot
PARAMS_PHYS := $(params_phys-y)
INITRD_PHYS := $(initrd_phys-y)
export ZRELADDR INITRD_PHYS PARAMS_PHYS
通过下面的命令编译内核映像,由参数-a, -e设置其入口地址为ZRELADDR,此值在上面ZRELADDR := $(zreladdr-y)指定。
quiet_cmd_uimage= UIMAGE $@
cmd_uimage = $(CONFIG_SHELL) $(MKIMAGE) -A arm -O linux -T kernel \
-C none -a $(ZRELADDR) -e $(ZRELADDR) \
-n 'Linux-$(KERNELRELEASE)' -d $< $@
1.3. 小结
从上面分析可知道,linux内核被bootloader拷贝到RAM后,解压代码从ZTEXTADDR开始运行(这段代码是与位置无关的PIC)。内核被解压缩到ZREALADDR处,也就是内核启动的物理地址处。相应地,内核启动的虚拟地址被设定为TEXTADDR,满足如下条件:
TEXTADDR = PAGE_OFFSET + TEXT_OFFSET
内核启动的物理地址和虚拟地址满足入下条件:
ZRELADDR == virt_to_phys(PAGE_OFFSET + TEXT_OFFSET)= virt_to_phys(TEXTADDR)
假定开发板为smdk2410,则有:
内核启动的虚拟地址
TEXTADDR = 0xC0008000
内核启动的物理地址
ZRELADDR = 0x30008000
如果直接从flash中启动还需要设置ZTEXTADDR地址。
2. 内核启动过程分析
内核启动过程经过大体可以分为两个阶段:内核映像的自引导;linux内核子模块的初始化。
start
Decompress_kernel()
Call_kernel
Stext:
Prepare_namespace
Do_basic_setup
init
Rest_init
Setup_arch ……
Start_kernel
_enable_mmu
Execve(“/sbin/init”))
内核启动流程图
2.1. 内核映像的自引导
这阶段的主要工作是实现压缩内核的解压和进入内核代码的入口。
Bootloader完成系统引导后,内核映像被调入内存指定的物理地址ZTEXTADDR。典型的内核映像由自引导程序和压缩的VMlinux组成。因此在启动内核之前需要先把内核解压缩。内核映像的入口的第一条代码就是自引导程序。它在arch/arm/boot/compressed /head.S文件中。
Head.S文件主要功能是实现压缩内核的解压和跳转到内核vmlinux内核的入口。Decompress_kernel(): arch/arm/boot/compressed/misc.c 和call_kernel这两个函数实现了上述功能。在调用decompress_kernel()解压内核之前,需要确保解压后的内核代码不会覆盖掉原来的内核映像。以及设定内核代码的入口地址ZREALADDR。
.text
adr r0, LC0
ldmia r0, {r1, r2, r3, r4, r5, r6, ip, sp}
.type LC0, #object
LC0: .word LC0 @ r1
.word __bss_start @ r2
.word _end @ r3
.word zreladdr @ r4
.word _start @ r5
.word _got_start @ r6
.word _got_end @ ip
.word user_stack+4096 @ sp
上面这段代码得到内核代码的入口地址,保存在r4中。
/*
* Check to see if we will overwrite ourselves.
* r4 = final kernel address
* r5 = start of this image
* r2 = end of malloc space (and therefore this image)
* We basically want:
* r4 >= r2 -> OK
* r4 + image length <= r5 -> OK
*/
cmp r4, r2
bhs wont_overwrite
add r0, r4, #4096*1024 @ 4MB largest kernel size
cmp r0, r5
bls wont_overwrite
mov r5, r2 @ decompress after malloc space
mov r0, r5
mov r3, r7
bl decompress_kernel
b call_kernel
上面代码判断解压后的内核代码会不会覆盖原来的内核映像,然后调用内核解压缩函数decompress_kernel()。
ulg
decompress_kernel(ulg output_start, ulg free_mem_ptr_p, ulg free_mem_ptr_end_p,
int arch_id)
{
output_data = (uch *)output_start; /* 指定内核执行地址,保存在r4中*/
free_mem_ptr = free_mem_ptr_p;
free_mem_ptr_end = free_mem_ptr_end_p;
__machine_arch_type = arch_id;
arch_decomp_setup(); /*解压缩前的初始化和设置,包括串口波特率设置等*/
makecrc(); /*CRC校验*/
putstr("Uncompressing Linux...");
gunzip(); /*调用解压缩函数*/
putstr(" done, booting the kernel.\n");
return output_ptr;
}
把内核映像解压到ZERALADDR地址后,调用call_kernel函数进入内核代码的入口地址。
call_kernel: bl cache_clean_flush
bl cache_off
mov r0, #0 @ must be zero
mov r1, r7 @ restore architecture number
mov r2, r8 @ restore atags pointer
mov pc, r4 @ call kernel
我们知道r4寄存器内保存的是内核的执行地址,mov pc, r4使得程序指针指向了内核的执行地址,所以下面将进入内核代码执行阶段。
2.2. linux内核子模块的初始化
2.2.1. 预备工作
进入真正的内核代码,首先执行的也是一个叫做head.S(arch/arm/kernel/)的文件。同时head.S也包含了同目录下head-common.S(arch/arm/kernel/)。这两个文件联合起来主要负责下面几项工作:
判断CPU类型,查找运行的CPU ID值与Linux编译支持的ID值是否支持
判断体系类型,查看R1寄存器的Architecture Type值是否支持
创建页表
开启MMU
跳转到start_kernel()(内核子模块初始化程序)
注: 暂时不对各个子程序实现作细节性的分析。
2.2.2. 内核各子模块初始化
Start_kernel函数是Linux内核通用的初始化函数。无论对于什么体系结构的Linux,都要执行这个函数。Start_kernel()函数是内核初始化的基本过程。下面按照函数对内核模块初始化的先后顺序进行分析。
start_kernel函数位于init/main.c
asmlinkage void __init start_kernel(void)
{
char * command_line;
extern struct kernel_param __start___param[], __stop___param[];
smp_setup_processor_id(); /*指定当前的cpu的逻辑号,这个函数对应于对称多处理器的设置,当系统中只有一个cpu的情况,此函数为空,什么也不做*/
lockdep_init(); /* 初始化lockdep hash 表 */
/* 初始化irq */
local_irq_disable();
early_boot_irqs_off();
early_init_irq_lock_class();
/* 锁定内核、设置cpu的状态为’present’,’online’等状态、初始化页表、打印内核版本号等信息、设置体系结构、为cpu分配启动内存空间 ,在此期间中断仍然处于关闭状态*/
lock_kernel();
boot_cpu_init();
page_address_init();
printk(KERN_NOTICE);
printk(linux_banner);
setup_arch(&command_line);
setup_per_cpu_areas();
smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
/*在打开任何中断之前打开调度器 */
sched_init();
/*关闭任务抢占功能,因为早期的调度器功能比较脆弱,直到第一次调用cpu_idle()*/
preempt_disable();
/* 建立内存区域链表节点,对于单cpu节点数为1 */
build_all_zonelists();
/* 发通知给每个CPU,处理每个CPU的内存状态*/
page_alloc_init();
/* 分析早期没命令参数*/
printk(KERN_NOTICE "Kernel command line: %s\n", saved_command_line);
parse_early_param();
/* 分析命令参数 */
parse_args("Booting kernel", command_line, __start___param,
__stop___param - __start___param,
&unknown_bootoption);
/* 排序内核创建的异常表 */
sort_main_extable();
unwind_init();
/*设置陷阱门和中断门 */
trap_init();
/*初始化内核中的读-拷贝-更新(Read-Copy-Update RCU)子系统 */
rcu_init();
/*初始化IRQ */
init_IRQ();
/* 按照开发办上的物理内存初始化pid hash表 */
pidhash_init();
/*初始化计时器 */
init_timers();
/* 高解析度&高精度的计时器 (high resolution)初始化 */
hrtimers_init();
/*初始化软中断 */
softirq_init();
/* 初始化时钟资源和普通计时器的值 */
timekeeping_init();
/* 初始化系统时间*/
time_init();
/*为内核分配内存以存储收集的数据*/
profile_init();
/* 开中断 */
if (!irqs_disabled())
printk("start_kernel(): bug: interrupts were enabled early\n");
early_boot_irqs_on();
local_irq_enable();
/*
* HACK ALERT! This is early. We're enabling the console before
* we've done PCI setups etc, and console_init() must be aware of
* this. But we do want output early, in case something goes wrong.
*/
/* 初始化控制台,为了能够尽早地帮助调试,显示系统引导的信息*/
console_init();
if (panic_later)
panic(panic_later, panic_param);
/*如果定义了CONFIG_LOCKDEP宏,则打印锁依赖信息,否则什么也不做 */
lockdep_info();
/*
* Need to run this when irqs are enabled, because it wants
* to self-test [hard/soft]-irqs on/off lock inversion bugs
* too:
*/
/* 如果定义CONFIG_DEBUG_LOCKING_API_SELFTESTS宏,则locking_selftest()是一个空函数,否则执行锁自测*/
locking_selftest();
#ifdef CONFIG_BLK_DEV_INITRD
if (initrd_start && !initrd_below_start_ok &&
initrd_start < min_low_pfn << PAGE_SHIFT) {
printk(KERN_CRIT "initrd overwritten (0x%08lx < 0x%08lx) - "
"disabling it.\n",initrd_start,min_low_pfn << PAGE_SHIFT);
initrd_start = 0;
}
#endif
/*
(1)dcache_init()创建SLAB缓存,该缓存保存目录项描述符。传存本身被称作dentry_cache。当进程访问文件或目录时所涉及的目录名有多个目录分量组成,目录项描述符就是针对每个分量而创建的。目录项各结构把文件或目录分量与其索引结点结合起来,因而可以通过该目录项可以更快地找到与其对应的索引结点
(2)inode_init()初始化哈希表索引结点和等待队列对头,该队头存放内核要锁存的哈希索引结点。
(3)file_init()确定给每个进程呢个zhogn的文件所分配的最大内存量
(4)mnt_init()创建了保存vfsmount对象且名为mnt_cache的缓存,VFS利用这协对吸纳给来挂载文件系统。该例程也创建 mount_hashtable队列,该队列存放mnt_cache中引用的快速访问对象。然后该例程发出调用来初始化sysfs文件系统并挂载root 文件系统。
*/
vfs_caches_init_early();
cpuset_init_early();
/* Mem_init()函数为mem_map中的自由区作标记并且打印出自由内存的大小。这个函数在系统的各个部分申请过内存后执行 */
mem_init();
/* 初始化cache相关的链表,函数在初始化页表分配器后smp_init()之前执行 */
kmem_cache_init();
/* 为逻辑号为0的cpu初始化页面。如果是smp情况下,只要cpu表现为online态,此函数就会执行 */
setup_per_cpu_pageset();
/* numa内存策略器初始化 */
numa_policy_init();
/* 内存初始化后调用 */
if (late_time_init)
late_time_init();
/*计算并打印许多著名的"BogoMips"的值,该值度量处理器在一个时钟节拍内可以反复执行多少个delay().对不同速度的处理器,cali_brate_delay()允许的延迟大约相同*/
calibrate_delay();
/* 初始化pidmap_array,分配pid=0给当前进程 */
pidmap_init();
/* 初始化页表高速缓存 */
pgtable_cache_init();
/*初始化优先级树index_bits_to_maxindex数组*/
prio_tree_init();
/*创建anon_vma结构对象slab缓存*/
anon_vma_init();
#ifdef CONFIG_X86
if (efi_enabled)
efi_enter_virtual_mode();
#endif
/*根据可用内存大小来建立用户缓冲区uid_cache,初始化最大线程数max_threads,为init_task配置RLIMIT_NPROC的值为max_threads/2 */
fork_init(num_physpages);
/*建立各种块缓冲区,比如VFS, VM等*/
proc_caches_init();
buffer_init();
unnamed_dev_init();
key_init();
security_init();
vfs_caches_init(num_physpages);
radix_tree_init();
signals_init();
/* rootfs populating might need page-writeback */
page_writeback_init();
#ifdef CONFIG_PROC_FS
proc_root_init();
#endif
cpuset_init();
taskstats_init_early();
delayacct_init();
/*检查错误,其实是调用check_writebuffer_bugs()函数检查是否有物理地址混淆的现象 */
check_bugs();
/* advanced configuration and power management interface */
acpi_early_init(); /* before LAPIC and SMP init */
/* Do the rest non-__init'ed, we're now alive */
/* 创建init进程,删除内核锁,启动idle线程 */
rest_init();
}
进入init进程后,将执行init()函数负责完成挂接根文件系统、初始化设备驱动和启动用户空间的init进程。(sunny 负责研究这部分)
==============================另一篇====================================
摘 要: 嵌入式 Linux 的可移植性使得我们可以在各种电子产品上看到它的身影。对于不
同体系结构的处理器来说Linux的启动过程也有所不同。本文以S3C2410 ARM处理器为例,
详细分析了系统上电后 bootloader的执行流程及 ARM Linux的启动过程。
关键词:ARM Linux bootloader 启动过程
中图分类号:TP316
1. 引 言
Linux 最初是由瑞典赫尔辛基大学的学生 Linus Torvalds在1991 年开发出来的,之后在
GNU的支持下,Linux 获得了巨大的发展。虽然 Linux 在桌面 PC 机上的普及程度远不及微
软的 Windows 操作系统,但它的发展速度之快、用户数量的日益增多,也是微软所不能轻
视的。而近些年来 Linux 在嵌入式领域的迅猛发展,更是给 Linux 注入了新的活力。
一个嵌入式 Linux 系统从软件角度看可以分为四个部分[1]
:引导加载程序(bootloader),
Linux 内核,文件系统,应用程序。
其中 bootloader是系统启动或复位以后执行的第一段代码,它主要用来初始化处理器及
外设,然后调用 Linux 内核。Linux 内核在完成系统的初始化之后需要挂载某个文件系统做
为根文件系统(Root Filesystem)。根文件系统是 Linux 系统的核心组成部分,它可以做为
Linux 系统中文件和数据的存储区域,通常它还包括系统配置文件和运行应用软件所需要的
库。应用程序可以说是嵌入式系统的“灵魂”,它所实现的功能通常就是设计该嵌入式系统
所要达到的目标。如果没有应用程序的支持,任何硬件上设计精良的嵌入式系统都没有实用
意义。
从以上分析我们可以看出 bootloader 和 Linux 内核在嵌入式系统中的关系和作用。
Bootloader在运行过程中虽然具有初始化系统和执行用户输入的命令等作用,但它最根本的
功能就是为了启动 Linux 内核。在嵌入式系统开发的过程中,很大一部分精力都是花在
bootloader 和 Linux 内核的开发或移植上。如果能清楚的了解 bootloader 执行流程和 Linux
的启动过程,将有助于明确开发过程中所需的工作,从而加速嵌入式系统的开发过程。而这
正是本文的所要研究的内容。
2. Bootloader
2.1 Bootloader的概念和作用
Bootloader是嵌入式系统的引导加载程序,它是系统上电后运行的第一段程序,其作用
类似于 PC 机上的 BIOS。在完成对系统的初始化任务之后,它会将非易失性存储器(通常
是 Flash或 DOC 等)中的Linux 内核拷贝到 RAM 中去,然后跳转到内核的第一条指令处继
续执行,从而启动 Linux 内核。
由此可见,bootloader 和 Linux 内核有着密不可分的联系,要想清楚的了解 Linux内核
的启动过程,我们必须先得认识 bootloader的执行过程,这样才能对嵌入式系统的整个启动
过程有清晰的掌握。
2.2 Bootloader的执行过程
不同的处理器上电或复位后执行的第一条指令地址并不相同,对于 ARM 处理器来说,
该地址为 0x00000000。对于一般的嵌入式系统,通常把 Flash 等非易失性存储器映射到这个
地址处,而 bootloader就位于该存储器的最前端,所以系统上电或复位后执行的第一段程序
便是 bootloader。而因为存储 bootloader的存储器不同,bootloader的执行过程也并不相同,
下面将具体分析。
嵌入式系统中广泛采用的非易失性存储器通常是 Flash,而 Flash 又分为 Nor Flash 和
Nand Flash 两种。 它们之间的不同在于: Nor Flash 支持芯片内执行(XIP, eXecute In Place),
这样代码可以在Flash上直接执行而不必拷贝到RAM中去执行。而Nand Flash并不支持XIP,
所以要想执行 Nand Flash 上的代码,必须先将其拷贝到 RAM中去,然后跳到 RAM 中去执
行。
实际应用中的 bootloader根据所需功能的不同可以设计得很复杂,除完成基本的初始化
系统和调用 Linux 内核等基本任务外,还可以执行很多用户输入的命令,比如设置 Linux 启
动参数,给 Flash 分区等;也可以设计得很简单,只完成最基本的功能。但为了能达到启动
Linux 内核的目的,所有的 bootloader都必须具备以下功能[2]
:
1) 初始化 RAM
因为 Linux 内核一般都会在 RAM 中运行,所以在调用 Linux 内核之前 bootloader 必须
设置和初始化 RAM,为调用 Linux内核做好准备。初始化 RAM 的任务包括设置 CPU 的控
制寄存器参数,以便能正常使用 RAM 以及检测RAM 大小等。
2) 初始化串口
串口在 Linux 的启动过程中有着非常重要的作用,它是 Linux内核和用户交互的方式之
一。Linux 在启动过程中可以将信息通过串口输出,这样便可清楚的了解 Linux 的启动过程。
虽然它并不是 bootloader 必须要完成的工作,但是通过串口输出信息是调试 bootloader 和
Linux 内核的强有力的工具,所以一般的 bootloader 都会在执行过程中初始化一个串口做为
调试端口。
3) 检测处理器类型
Bootloader在调用 Linux内核前必须检测系统的处理器类型,并将其保存到某个常量中
提供给 Linux 内核。Linux 内核在启动过程中会根据该处理器类型调用相应的初始化程序。
4) 设置 Linux启动参数
Bootloader在执行过程中必须设置和初始化 Linux 的内核启动参数。目前传递启动参数
主要采用两种方式:即通过 struct param_struct 和struct tag(标记列表,tagged list)两种结
构传递。struct param_struct 是一种比较老的参数传递方式,在 2.4 版本以前的内核中使用较
多。从 2.4 版本以后 Linux 内核基本上采用标记列表的方式。但为了保持和以前版本的兼容
性,它仍支持 struct param_struct 参数传递方式,只不过在内核启动过程中它将被转换成标
记列表方式。
标记列表方式是种比较新的参数传递方式,它必须以 ATAG_CORE 开始,并以
ATAG_NONE 结尾。中间可以根据需要加入其他列表。Linux内核在启动过程中会根据该启
动参数进行相应的初始化工作。
5) 调用 Linux内核映像
Bootloader完成的最后一项工作便是调用 Linux内核。如果 Linux 内核存放在 Flash 中,
并且可直接在上面运行(这里的 Flash 指 Nor Flash),那么可直接跳转到内核中去执行。
但由于在 Flash 中执行代码会有种种限制,而且速度也远不及 RAM 快,所以一般的嵌
入式系统都是将 Linux内核拷贝到 RAM 中,然后跳转到 RAM 中去执行。
不论哪种情况,在跳到 Linux 内核执行之前 CUP的寄存器必须满足以下条件:r0=0,
r1=处理器类型,r2=标记列表在 RAM中的地址。
3. Linux内核的启动过程
在 bootloader将 Linux 内核映像拷贝到 RAM 以后,可以通过下例代码启动 Linux 内核:
call_linux(0, machine_type, kernel_params_base)。
其中,machine_tpye 是 bootloader检测出来的处理器类型, kernel_params_base 是启动参
数在 RAM 的地址。通过这种方式将 Linux 启动需要的参数从 bootloader传递到内核。
Linux 内核有两种映像:一种是非压缩内核,叫 Image,另一种是它的压缩版本,叫
zImage。根据内核映像的不同,Linux 内核的启动在开始阶段也有所不同。zImage 是 Image
经过压缩形成的,所以它的大小比 Image 小。但为了能使用 zImage,必须在它的开头加上
解压缩的代码,将 zImage 解压缩之后才能执行,因此它的执行速度比 Image 要慢。但考虑
到嵌入式系统的存储空容量一般比较小,采用 zImage 可以占用较少的存储空间,因此牺牲
一点性能上的代价也是值得的。所以一般的嵌入式系统均采用压缩内核的方式。
对于 ARM 系列处理器来说,zImage 的入口程序即为 arch/arm/boot/compressed/head.S。
它依次完成以下工作:开启 MMU 和 Cache,调用 decompress_kernel()解压内核,最后通过
调用 call_kernel()进入非压缩内核 Image 的启动。下面将具体分析在此之后 Linux 内核的启
动过程。
3.1 Linux内核入口
Linux 非压缩内核的入口位于文件/arch/arm/kernel/head-armv.S 中的 stext 段。该段的基
地址就是压缩内核解压后的跳转地址。如果系统中加载的内核是非压缩的 Image,那么
bootloader将内核从 Flash中拷贝到 RAM 后将直接跳到该地址处,从而启动 Linux 内核。
不同体系结构的 Linux 系统的入口文件是不同的,而且因为该文件与具体体系结构有
关,所以一般均用汇编语言编写[3]
。对基于 ARM 处理的 Linux 系统来说,该文件就是
head-armv.S。该程序通过查找处理器内核类型和处理器类型调用相应的初始化函数,再建
立页表,最后跳转到 start_kernel()函数开始内核的初始化工作。
检测处理器内核类型是在汇编子函数__lookup_processor_type中完成的。通过以下代码
可实现对它的调用:
bl __lookup_processor_type。
__lookup_processor_type调用结束返回原程序时,会将返回结果保存到寄存器中。其中
r8 保存了页表的标志位,r9 保存了处理器的 ID 号,r10 保存了与处理器相关的 stru
proc_info_list 结构地址。
检测处理器类型是在汇编子函数 __lookup_architecture_type 中完成的。与
__lookup_processor_type类似,它通过代码:“bl __lookup_processor_type”来实现对它的调
用。该函数返回时,会将返回结构保存在 r5、r6 和 r7 三个寄存器中。其中 r5 保存了 RAM
的起始基地址,r6 保存了 I/O基地址,r7 保存了 I/O的页表偏移地址。
当检测处理器内核和处理器类型结束后,将调用__create_page_tables 子函数来建立页
表,它所要做的工作就是将 RAM 基地址开始的 4M 空间的物理地址映射到 0xC0000000 开
始的虚拟地址处。对笔者的 S3C2410 开发板而言,RAM 连接到物理地址 0x30000000 处,
当调用 __create_page_tables 结束后 0x30000000 ~ 0x30400000 物理地址将映射到
0xC0000000~0xC0400000 虚拟地址处。
当所有的初始化结束之后,使用如下代码来跳到 C 程序的入口函数 start_kernel()处,开
始之后的内核初始化工作:
b SYMBOL_NAME(start_kernel)
3.2 start_kernel函数
start_kernel是所有 Linux 平台进入系统内核初始化后的入口函数,它主要完成剩余的与
硬件平台相关的初始化工作,在进行一系列与内核相关的初始化后,调用第一个用户进程-
init 进程并等待用户进程的执行,这样整个 Linux 内核便启动完毕。该函数所做的具体工作
有[4][5]
:
1) 调用 setup_arch()函数进行与体系结构相关的第一个初始化工作;
对不同的体系结构来说该函数有不同的定义。对于 ARM 平台而言,该函数定义在
arch/arm/kernel/Setup.c。它首先通过检测出来的处理器类型进行处理器内核的初始化,然后
通过 bootmem_init()函数根据系统定义的 meminfo 结构进行内存结构的初始化,最后调用
paging_init()开启 MMU,创建内核页表,映射所有的物理内存和 IO空间。
2) 创建异常向量表和初始化中断处理函数;
3) 初始化系统核心进程调度器和时钟中断处理机制;
4) 初始化串口控制台(serial-console);
ARM-Linux 在初始化过程中一般都会初始化一个串口做为内核的控制台,这样内核在
启动过程中就可以通过串口输出信息以便开发者或用户了解系统的启动进程。
5) 创建和初始化系统 cache,为各种内存调用机制提供缓存,包括;动态内存分配,虚拟文
件系统(VirtualFile System)及页缓存。
6) 初始化内存管理,检测内存大小及被内核占用的内存情况;
7) 初始化系统的进程间通信机制(IPC);
当以上所有的初始化工作结束后,start_kernel()函数会调用 rest_init()函数来进行最后的
初始化,包括创建系统的第一个进程-init 进程来结束内核的启动。Init 进程首先进行一系
列的硬件初始化,然后通过命令行传递过来的参数挂载根文件系统。最后 init 进程会执行用
户传递过来的“init=”启动参数执行用户指定的命令,或者执行以下几个进程之一:
execve("/sbin/init",argv_init,envp_init);
execve("/etc/init",argv_init,envp_init);
execve("/bin/init",argv_init,envp_init);
execve("/bin/sh",argv_init,envp_init)。
当所有的初始化工作结束后,cpu_idle()函数会被调用来使系统处于闲置(idle)状态并
等待用户程序的执行。至此,整个 Linux 内核启动完毕
1.1. 名词解释
ZTEXTADDR
解压代码运行的开始地址。没有物理地址和虚拟地址之分,因为此时MMU处于关闭状态。这个地址不一定时RAM的地址,可以是支持读写寻址的flash等存储中介。
Start address of decompressor. here's no point in talking about virtual or physical addresses here, since the MMU will be off at the time when you call the decompressor code. You normally call the kernel at this address to start it booting. This doesn't have to be located in RAM, it can be in flash or other read-only or read-write addressable medium.
ZRELADDR
内核启动在RAM中的地址。压缩的内核映像被解压到这个地址,然后执行。
This is the address where the decompressed kernel will be written, and eventually executed. The following constraint must be valid:
__virt_to_phys(TEXTADDR) == ZRELADDR
The initial part of the kernel is carefully coded to be position independent.
TEXTADDR
内核启动的虚拟地址,与ZRELADDR相对应。一般内核启动的虚拟地址为RAM的第一个bank地址加上0x8000。
TEXTADDR = PAGE_OFFSET + TEXTOFFST
Virtual start address of kernel, normally PAGE_OFFSET + 0x8000.This is where the kernel image ends up. With the latest kernels, it must be located at 32768 bytes into a 128MB region. Previous kernels placed a restriction of 256MB here.
TEXTOFFSET
内核偏移地址。在arch/arm/makefile中设定。
PHYS_OFFSET
RAM第一个bank的物理起始地址。
Physical start address of the first bank of RAM.
PAGE_OFFSET
RAM第一个bank的虚拟起始地址。
Virtual start address of the first bank of RAM. During the kernel
boot phase, virtual address PAGE_OFFSET will be mapped to physical
address PHYS_OFFSET, along with any other mappings you supply.
This should be the same value as TASK_SIZE.
1.2. 内核启动地址确定
内核启动引导地址由bootp.lds决定。 Bootp.lds : arch/arm/bootp
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = 0;
.text : {
_stext = .;
*(.start)
*(.text)
initrd_size = initrd_end - initrd_start;
_etext = .;
}
}
由上 .= 0可以确定解压代码运行的开始地址在0x0的位置。ZTEXTADDR的值决定了这个值得选取。
Makefile : arch/arm/boot/compressed
如果设定内核从ROM中启动的话,可以在make menuconfig 的配置界面中设置解压代码的起始地址,否则解压代码的起始地址为0x0。实际上,默认从ROM启动时,解压代码的起始地址也是0x0。
feq ($(CONFIG_ZBOOT_ROM),y)
ZTEXTADDR := $(CONFIG_ZBOOT_ROM_TEXT)
ZBSSADDR := $(CONFIG_ZBOOT_ROM_BSS)
else
ZTEXTADDR :=0 ZBSSADDR := ALIGN(4)
endif
SEDFLAGS = s/TEXT_START/$(ZTEXTADDR)/;s/BSS_START/$(ZBSSADDR)/
……
$(obj)/vmlinux.lds: $(obj)/vmlinux.lds.in arch/arm/mach-s3c2410/Makefile .config
@sed "$(SEDFLAGS)" < $< > $@
@sed "$(SEDFLAGS)" < $< > $@ 规则将TEXT_START设定为ZTEXTADDR。TEXT_START在arch/arm/boot/compressed /vmlinux.lds.in 中被用来设定解压代码的起始地址。
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = TEXT_START;
_text = .;
.text : {
_start = .;
*(.start)
*(.text)
*(.text.*)
……
}
}
内核的编译依靠vmlinux.lds,vmlinux.lds由vmlinux.lds.s 生成。从下面代码可以看出内核启动的虚拟地址被设置为PAGE_OFFSET + TEXT_OFFSET,而内核启动的物理地址ZRELADDR在arch/arm/boot/Makefile中设定。
OUTPUT_ARCH(arm)
ENTRY(stext)
SECTIONS
{
#ifdef CONFIG_XIP_KERNEL
. = XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR);
#else
. = PAGE_OFFSET + TEXT_OFFSET;
#endif
.init : { /* Init code and data */
_stext = .;
_sinittext = .;
*(.init.text)
_einittext = .;
……
}
}
# arch/arm/boot/Makefile
# Note: the following conditions must always be true:
# ZRELADDR == virt_to_phys(PAGE_OFFSET + TEXT_OFFSET)
# PARAMS_PHYS must be within 4MB of ZRELADDR
# INITRD_PHYS must be in RAM
ZRELADDR := $(zreladdr-y)
#---> zrealaddr-y is specified with 0x30008000 in arch/arm/boot/makefile.boot
PARAMS_PHYS := $(params_phys-y)
INITRD_PHYS := $(initrd_phys-y)
export ZRELADDR INITRD_PHYS PARAMS_PHYS
通过下面的命令编译内核映像,由参数-a, -e设置其入口地址为ZRELADDR,此值在上面ZRELADDR := $(zreladdr-y)指定。
quiet_cmd_uimage= UIMAGE $@
cmd_uimage = $(CONFIG_SHELL) $(MKIMAGE) -A arm -O linux -T kernel \
-C none -a $(ZRELADDR) -e $(ZRELADDR) \
-n 'Linux-$(KERNELRELEASE)' -d $< $@
1.3. 小结
从上面分析可知道,linux内核被bootloader拷贝到RAM后,解压代码从ZTEXTADDR开始运行(这段代码是与位置无关的PIC)。内核被解压缩到ZREALADDR处,也就是内核启动的物理地址处。相应地,内核启动的虚拟地址被设定为TEXTADDR,满足如下条件:
TEXTADDR = PAGE_OFFSET + TEXT_OFFSET
内核启动的物理地址和虚拟地址满足入下条件:
ZRELADDR == virt_to_phys(PAGE_OFFSET + TEXT_OFFSET)= virt_to_phys(TEXTADDR)
假定开发板为smdk2410,则有:
内核启动的虚拟地址
TEXTADDR = 0xC0008000
内核启动的物理地址
ZRELADDR = 0x30008000
如果直接从flash中启动还需要设置ZTEXTADDR地址。
2. 内核启动过程分析
内核启动过程经过大体可以分为两个阶段:内核映像的自引导;linux内核子模块的初始化。
start
Decompress_kernel()
Call_kernel
Stext:
Prepare_namespace
Do_basic_setup
init
Rest_init
Setup_arch ……
Start_kernel
_enable_mmu
Execve(“/sbin/init”))
内核启动流程图
2.1. 内核映像的自引导
这阶段的主要工作是实现压缩内核的解压和进入内核代码的入口。
Bootloader完成系统引导后,内核映像被调入内存指定的物理地址ZTEXTADDR。典型的内核映像由自引导程序和压缩的VMlinux组成。因此在启动内核之前需要先把内核解压缩。内核映像的入口的第一条代码就是自引导程序。它在arch/arm/boot/compressed /head.S文件中。
Head.S文件主要功能是实现压缩内核的解压和跳转到内核vmlinux内核的入口。Decompress_kernel(): arch/arm/boot/compressed/misc.c 和call_kernel这两个函数实现了上述功能。在调用decompress_kernel()解压内核之前,需要确保解压后的内核代码不会覆盖掉原来的内核映像。以及设定内核代码的入口地址ZREALADDR。
.text
adr r0, LC0
ldmia r0, {r1, r2, r3, r4, r5, r6, ip, sp}
.type LC0, #object
LC0: .word LC0 @ r1
.word __bss_start @ r2
.word _end @ r3
.word zreladdr @ r4
.word _start @ r5
.word _got_start @ r6
.word _got_end @ ip
.word user_stack+4096 @ sp
上面这段代码得到内核代码的入口地址,保存在r4中。
/*
* Check to see if we will overwrite ourselves.
* r4 = final kernel address
* r5 = start of this image
* r2 = end of malloc space (and therefore this image)
* We basically want:
* r4 >= r2 -> OK
* r4 + image length <= r5 -> OK
*/
cmp r4, r2
bhs wont_overwrite
add r0, r4, #4096*1024 @ 4MB largest kernel size
cmp r0, r5
bls wont_overwrite
mov r5, r2 @ decompress after malloc space
mov r0, r5
mov r3, r7
bl decompress_kernel
b call_kernel
上面代码判断解压后的内核代码会不会覆盖原来的内核映像,然后调用内核解压缩函数decompress_kernel()。
ulg
decompress_kernel(ulg output_start, ulg free_mem_ptr_p, ulg free_mem_ptr_end_p,
int arch_id)
{
output_data = (uch *)output_start; /* 指定内核执行地址,保存在r4中*/
free_mem_ptr = free_mem_ptr_p;
free_mem_ptr_end = free_mem_ptr_end_p;
__machine_arch_type = arch_id;
arch_decomp_setup(); /*解压缩前的初始化和设置,包括串口波特率设置等*/
makecrc(); /*CRC校验*/
putstr("Uncompressing Linux...");
gunzip(); /*调用解压缩函数*/
putstr(" done, booting the kernel.\n");
return output_ptr;
}
把内核映像解压到ZERALADDR地址后,调用call_kernel函数进入内核代码的入口地址。
call_kernel: bl cache_clean_flush
bl cache_off
mov r0, #0 @ must be zero
mov r1, r7 @ restore architecture number
mov r2, r8 @ restore atags pointer
mov pc, r4 @ call kernel
我们知道r4寄存器内保存的是内核的执行地址,mov pc, r4使得程序指针指向了内核的执行地址,所以下面将进入内核代码执行阶段。
2.2. linux内核子模块的初始化
2.2.1. 预备工作
进入真正的内核代码,首先执行的也是一个叫做head.S(arch/arm/kernel/)的文件。同时head.S也包含了同目录下head-common.S(arch/arm/kernel/)。这两个文件联合起来主要负责下面几项工作:
判断CPU类型,查找运行的CPU ID值与Linux编译支持的ID值是否支持
判断体系类型,查看R1寄存器的Architecture Type值是否支持
创建页表
开启MMU
跳转到start_kernel()(内核子模块初始化程序)
注: 暂时不对各个子程序实现作细节性的分析。
2.2.2. 内核各子模块初始化
Start_kernel函数是Linux内核通用的初始化函数。无论对于什么体系结构的Linux,都要执行这个函数。Start_kernel()函数是内核初始化的基本过程。下面按照函数对内核模块初始化的先后顺序进行分析。
start_kernel函数位于init/main.c
asmlinkage void __init start_kernel(void)
{
char * command_line;
extern struct kernel_param __start___param[], __stop___param[];
smp_setup_processor_id(); /*指定当前的cpu的逻辑号,这个函数对应于对称多处理器的设置,当系统中只有一个cpu的情况,此函数为空,什么也不做*/
lockdep_init(); /* 初始化lockdep hash 表 */
/* 初始化irq */
local_irq_disable();
early_boot_irqs_off();
early_init_irq_lock_class();
/* 锁定内核、设置cpu的状态为’present’,’online’等状态、初始化页表、打印内核版本号等信息、设置体系结构、为cpu分配启动内存空间 ,在此期间中断仍然处于关闭状态*/
lock_kernel();
boot_cpu_init();
page_address_init();
printk(KERN_NOTICE);
printk(linux_banner);
setup_arch(&command_line);
setup_per_cpu_areas();
smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
/*在打开任何中断之前打开调度器 */
sched_init();
/*关闭任务抢占功能,因为早期的调度器功能比较脆弱,直到第一次调用cpu_idle()*/
preempt_disable();
/* 建立内存区域链表节点,对于单cpu节点数为1 */
build_all_zonelists();
/* 发通知给每个CPU,处理每个CPU的内存状态*/
page_alloc_init();
/* 分析早期没命令参数*/
printk(KERN_NOTICE "Kernel command line: %s\n", saved_command_line);
parse_early_param();
/* 分析命令参数 */
parse_args("Booting kernel", command_line, __start___param,
__stop___param - __start___param,
&unknown_bootoption);
/* 排序内核创建的异常表 */
sort_main_extable();
unwind_init();
/*设置陷阱门和中断门 */
trap_init();
/*初始化内核中的读-拷贝-更新(Read-Copy-Update RCU)子系统 */
rcu_init();
/*初始化IRQ */
init_IRQ();
/* 按照开发办上的物理内存初始化pid hash表 */
pidhash_init();
/*初始化计时器 */
init_timers();
/* 高解析度&高精度的计时器 (high resolution)初始化 */
hrtimers_init();
/*初始化软中断 */
softirq_init();
/* 初始化时钟资源和普通计时器的值 */
timekeeping_init();
/* 初始化系统时间*/
time_init();
/*为内核分配内存以存储收集的数据*/
profile_init();
/* 开中断 */
if (!irqs_disabled())
printk("start_kernel(): bug: interrupts were enabled early\n");
early_boot_irqs_on();
local_irq_enable();
/*
* HACK ALERT! This is early. We're enabling the console before
* we've done PCI setups etc, and console_init() must be aware of
* this. But we do want output early, in case something goes wrong.
*/
/* 初始化控制台,为了能够尽早地帮助调试,显示系统引导的信息*/
console_init();
if (panic_later)
panic(panic_later, panic_param);
/*如果定义了CONFIG_LOCKDEP宏,则打印锁依赖信息,否则什么也不做 */
lockdep_info();
/*
* Need to run this when irqs are enabled, because it wants
* to self-test [hard/soft]-irqs on/off lock inversion bugs
* too:
*/
/* 如果定义CONFIG_DEBUG_LOCKING_API_SELFTESTS宏,则locking_selftest()是一个空函数,否则执行锁自测*/
locking_selftest();
#ifdef CONFIG_BLK_DEV_INITRD
if (initrd_start && !initrd_below_start_ok &&
initrd_start < min_low_pfn << PAGE_SHIFT) {
printk(KERN_CRIT "initrd overwritten (0x%08lx < 0x%08lx) - "
"disabling it.\n",initrd_start,min_low_pfn << PAGE_SHIFT);
initrd_start = 0;
}
#endif
/*
(1)dcache_init()创建SLAB缓存,该缓存保存目录项描述符。传存本身被称作dentry_cache。当进程访问文件或目录时所涉及的目录名有多个目录分量组成,目录项描述符就是针对每个分量而创建的。目录项各结构把文件或目录分量与其索引结点结合起来,因而可以通过该目录项可以更快地找到与其对应的索引结点
(2)inode_init()初始化哈希表索引结点和等待队列对头,该队头存放内核要锁存的哈希索引结点。
(3)file_init()确定给每个进程呢个zhogn的文件所分配的最大内存量
(4)mnt_init()创建了保存vfsmount对象且名为mnt_cache的缓存,VFS利用这协对吸纳给来挂载文件系统。该例程也创建 mount_hashtable队列,该队列存放mnt_cache中引用的快速访问对象。然后该例程发出调用来初始化sysfs文件系统并挂载root 文件系统。
*/
vfs_caches_init_early();
cpuset_init_early();
/* Mem_init()函数为mem_map中的自由区作标记并且打印出自由内存的大小。这个函数在系统的各个部分申请过内存后执行 */
mem_init();
/* 初始化cache相关的链表,函数在初始化页表分配器后smp_init()之前执行 */
kmem_cache_init();
/* 为逻辑号为0的cpu初始化页面。如果是smp情况下,只要cpu表现为online态,此函数就会执行 */
setup_per_cpu_pageset();
/* numa内存策略器初始化 */
numa_policy_init();
/* 内存初始化后调用 */
if (late_time_init)
late_time_init();
/*计算并打印许多著名的"BogoMips"的值,该值度量处理器在一个时钟节拍内可以反复执行多少个delay().对不同速度的处理器,cali_brate_delay()允许的延迟大约相同*/
calibrate_delay();
/* 初始化pidmap_array,分配pid=0给当前进程 */
pidmap_init();
/* 初始化页表高速缓存 */
pgtable_cache_init();
/*初始化优先级树index_bits_to_maxindex数组*/
prio_tree_init();
/*创建anon_vma结构对象slab缓存*/
anon_vma_init();
#ifdef CONFIG_X86
if (efi_enabled)
efi_enter_virtual_mode();
#endif
/*根据可用内存大小来建立用户缓冲区uid_cache,初始化最大线程数max_threads,为init_task配置RLIMIT_NPROC的值为max_threads/2 */
fork_init(num_physpages);
/*建立各种块缓冲区,比如VFS, VM等*/
proc_caches_init();
buffer_init();
unnamed_dev_init();
key_init();
security_init();
vfs_caches_init(num_physpages);
radix_tree_init();
signals_init();
/* rootfs populating might need page-writeback */
page_writeback_init();
#ifdef CONFIG_PROC_FS
proc_root_init();
#endif
cpuset_init();
taskstats_init_early();
delayacct_init();
/*检查错误,其实是调用check_writebuffer_bugs()函数检查是否有物理地址混淆的现象 */
check_bugs();
/* advanced configuration and power management interface */
acpi_early_init(); /* before LAPIC and SMP init */
/* Do the rest non-__init'ed, we're now alive */
/* 创建init进程,删除内核锁,启动idle线程 */
rest_init();
}
进入init进程后,将执行init()函数负责完成挂接根文件系统、初始化设备驱动和启动用户空间的init进程。(sunny 负责研究这部分)
==============================另一篇====================================
摘 要: 嵌入式 Linux 的可移植性使得我们可以在各种电子产品上看到它的身影。对于不
同体系结构的处理器来说Linux的启动过程也有所不同。本文以S3C2410 ARM处理器为例,
详细分析了系统上电后 bootloader的执行流程及 ARM Linux的启动过程。
关键词:ARM Linux bootloader 启动过程
中图分类号:TP316
1. 引 言
Linux 最初是由瑞典赫尔辛基大学的学生 Linus Torvalds在1991 年开发出来的,之后在
GNU的支持下,Linux 获得了巨大的发展。虽然 Linux 在桌面 PC 机上的普及程度远不及微
软的 Windows 操作系统,但它的发展速度之快、用户数量的日益增多,也是微软所不能轻
视的。而近些年来 Linux 在嵌入式领域的迅猛发展,更是给 Linux 注入了新的活力。
一个嵌入式 Linux 系统从软件角度看可以分为四个部分[1]
:引导加载程序(bootloader),
Linux 内核,文件系统,应用程序。
其中 bootloader是系统启动或复位以后执行的第一段代码,它主要用来初始化处理器及
外设,然后调用 Linux 内核。Linux 内核在完成系统的初始化之后需要挂载某个文件系统做
为根文件系统(Root Filesystem)。根文件系统是 Linux 系统的核心组成部分,它可以做为
Linux 系统中文件和数据的存储区域,通常它还包括系统配置文件和运行应用软件所需要的
库。应用程序可以说是嵌入式系统的“灵魂”,它所实现的功能通常就是设计该嵌入式系统
所要达到的目标。如果没有应用程序的支持,任何硬件上设计精良的嵌入式系统都没有实用
意义。
从以上分析我们可以看出 bootloader 和 Linux 内核在嵌入式系统中的关系和作用。
Bootloader在运行过程中虽然具有初始化系统和执行用户输入的命令等作用,但它最根本的
功能就是为了启动 Linux 内核。在嵌入式系统开发的过程中,很大一部分精力都是花在
bootloader 和 Linux 内核的开发或移植上。如果能清楚的了解 bootloader 执行流程和 Linux
的启动过程,将有助于明确开发过程中所需的工作,从而加速嵌入式系统的开发过程。而这
正是本文的所要研究的内容。
2. Bootloader
2.1 Bootloader的概念和作用
Bootloader是嵌入式系统的引导加载程序,它是系统上电后运行的第一段程序,其作用
类似于 PC 机上的 BIOS。在完成对系统的初始化任务之后,它会将非易失性存储器(通常
是 Flash或 DOC 等)中的Linux 内核拷贝到 RAM 中去,然后跳转到内核的第一条指令处继
续执行,从而启动 Linux 内核。
由此可见,bootloader 和 Linux 内核有着密不可分的联系,要想清楚的了解 Linux内核
的启动过程,我们必须先得认识 bootloader的执行过程,这样才能对嵌入式系统的整个启动
过程有清晰的掌握。
2.2 Bootloader的执行过程
不同的处理器上电或复位后执行的第一条指令地址并不相同,对于 ARM 处理器来说,
该地址为 0x00000000。对于一般的嵌入式系统,通常把 Flash 等非易失性存储器映射到这个
地址处,而 bootloader就位于该存储器的最前端,所以系统上电或复位后执行的第一段程序
便是 bootloader。而因为存储 bootloader的存储器不同,bootloader的执行过程也并不相同,
下面将具体分析。
嵌入式系统中广泛采用的非易失性存储器通常是 Flash,而 Flash 又分为 Nor Flash 和
Nand Flash 两种。 它们之间的不同在于: Nor Flash 支持芯片内执行(XIP, eXecute In Place),
这样代码可以在Flash上直接执行而不必拷贝到RAM中去执行。而Nand Flash并不支持XIP,
所以要想执行 Nand Flash 上的代码,必须先将其拷贝到 RAM中去,然后跳到 RAM 中去执
行。
实际应用中的 bootloader根据所需功能的不同可以设计得很复杂,除完成基本的初始化
系统和调用 Linux 内核等基本任务外,还可以执行很多用户输入的命令,比如设置 Linux 启
动参数,给 Flash 分区等;也可以设计得很简单,只完成最基本的功能。但为了能达到启动
Linux 内核的目的,所有的 bootloader都必须具备以下功能[2]
:
1) 初始化 RAM
因为 Linux 内核一般都会在 RAM 中运行,所以在调用 Linux 内核之前 bootloader 必须
设置和初始化 RAM,为调用 Linux内核做好准备。初始化 RAM 的任务包括设置 CPU 的控
制寄存器参数,以便能正常使用 RAM 以及检测RAM 大小等。
2) 初始化串口
串口在 Linux 的启动过程中有着非常重要的作用,它是 Linux内核和用户交互的方式之
一。Linux 在启动过程中可以将信息通过串口输出,这样便可清楚的了解 Linux 的启动过程。
虽然它并不是 bootloader 必须要完成的工作,但是通过串口输出信息是调试 bootloader 和
Linux 内核的强有力的工具,所以一般的 bootloader 都会在执行过程中初始化一个串口做为
调试端口。
3) 检测处理器类型
Bootloader在调用 Linux内核前必须检测系统的处理器类型,并将其保存到某个常量中
提供给 Linux 内核。Linux 内核在启动过程中会根据该处理器类型调用相应的初始化程序。
4) 设置 Linux启动参数
Bootloader在执行过程中必须设置和初始化 Linux 的内核启动参数。目前传递启动参数
主要采用两种方式:即通过 struct param_struct 和struct tag(标记列表,tagged list)两种结
构传递。struct param_struct 是一种比较老的参数传递方式,在 2.4 版本以前的内核中使用较
多。从 2.4 版本以后 Linux 内核基本上采用标记列表的方式。但为了保持和以前版本的兼容
性,它仍支持 struct param_struct 参数传递方式,只不过在内核启动过程中它将被转换成标
记列表方式。
标记列表方式是种比较新的参数传递方式,它必须以 ATAG_CORE 开始,并以
ATAG_NONE 结尾。中间可以根据需要加入其他列表。Linux内核在启动过程中会根据该启
动参数进行相应的初始化工作。
5) 调用 Linux内核映像
Bootloader完成的最后一项工作便是调用 Linux内核。如果 Linux 内核存放在 Flash 中,
并且可直接在上面运行(这里的 Flash 指 Nor Flash),那么可直接跳转到内核中去执行。
但由于在 Flash 中执行代码会有种种限制,而且速度也远不及 RAM 快,所以一般的嵌
入式系统都是将 Linux内核拷贝到 RAM 中,然后跳转到 RAM 中去执行。
不论哪种情况,在跳到 Linux 内核执行之前 CUP的寄存器必须满足以下条件:r0=0,
r1=处理器类型,r2=标记列表在 RAM中的地址。
3. Linux内核的启动过程
在 bootloader将 Linux 内核映像拷贝到 RAM 以后,可以通过下例代码启动 Linux 内核:
call_linux(0, machine_type, kernel_params_base)。
其中,machine_tpye 是 bootloader检测出来的处理器类型, kernel_params_base 是启动参
数在 RAM 的地址。通过这种方式将 Linux 启动需要的参数从 bootloader传递到内核。
Linux 内核有两种映像:一种是非压缩内核,叫 Image,另一种是它的压缩版本,叫
zImage。根据内核映像的不同,Linux 内核的启动在开始阶段也有所不同。zImage 是 Image
经过压缩形成的,所以它的大小比 Image 小。但为了能使用 zImage,必须在它的开头加上
解压缩的代码,将 zImage 解压缩之后才能执行,因此它的执行速度比 Image 要慢。但考虑
到嵌入式系统的存储空容量一般比较小,采用 zImage 可以占用较少的存储空间,因此牺牲
一点性能上的代价也是值得的。所以一般的嵌入式系统均采用压缩内核的方式。
对于 ARM 系列处理器来说,zImage 的入口程序即为 arch/arm/boot/compressed/head.S。
它依次完成以下工作:开启 MMU 和 Cache,调用 decompress_kernel()解压内核,最后通过
调用 call_kernel()进入非压缩内核 Image 的启动。下面将具体分析在此之后 Linux 内核的启
动过程。
3.1 Linux内核入口
Linux 非压缩内核的入口位于文件/arch/arm/kernel/head-armv.S 中的 stext 段。该段的基
地址就是压缩内核解压后的跳转地址。如果系统中加载的内核是非压缩的 Image,那么
bootloader将内核从 Flash中拷贝到 RAM 后将直接跳到该地址处,从而启动 Linux 内核。
不同体系结构的 Linux 系统的入口文件是不同的,而且因为该文件与具体体系结构有
关,所以一般均用汇编语言编写[3]
。对基于 ARM 处理的 Linux 系统来说,该文件就是
head-armv.S。该程序通过查找处理器内核类型和处理器类型调用相应的初始化函数,再建
立页表,最后跳转到 start_kernel()函数开始内核的初始化工作。
检测处理器内核类型是在汇编子函数__lookup_processor_type中完成的。通过以下代码
可实现对它的调用:
bl __lookup_processor_type。
__lookup_processor_type调用结束返回原程序时,会将返回结果保存到寄存器中。其中
r8 保存了页表的标志位,r9 保存了处理器的 ID 号,r10 保存了与处理器相关的 stru
proc_info_list 结构地址。
检测处理器类型是在汇编子函数 __lookup_architecture_type 中完成的。与
__lookup_processor_type类似,它通过代码:“bl __lookup_processor_type”来实现对它的调
用。该函数返回时,会将返回结构保存在 r5、r6 和 r7 三个寄存器中。其中 r5 保存了 RAM
的起始基地址,r6 保存了 I/O基地址,r7 保存了 I/O的页表偏移地址。
当检测处理器内核和处理器类型结束后,将调用__create_page_tables 子函数来建立页
表,它所要做的工作就是将 RAM 基地址开始的 4M 空间的物理地址映射到 0xC0000000 开
始的虚拟地址处。对笔者的 S3C2410 开发板而言,RAM 连接到物理地址 0x30000000 处,
当调用 __create_page_tables 结束后 0x30000000 ~ 0x30400000 物理地址将映射到
0xC0000000~0xC0400000 虚拟地址处。
当所有的初始化结束之后,使用如下代码来跳到 C 程序的入口函数 start_kernel()处,开
始之后的内核初始化工作:
b SYMBOL_NAME(start_kernel)
3.2 start_kernel函数
start_kernel是所有 Linux 平台进入系统内核初始化后的入口函数,它主要完成剩余的与
硬件平台相关的初始化工作,在进行一系列与内核相关的初始化后,调用第一个用户进程-
init 进程并等待用户进程的执行,这样整个 Linux 内核便启动完毕。该函数所做的具体工作
有[4][5]
:
1) 调用 setup_arch()函数进行与体系结构相关的第一个初始化工作;
对不同的体系结构来说该函数有不同的定义。对于 ARM 平台而言,该函数定义在
arch/arm/kernel/Setup.c。它首先通过检测出来的处理器类型进行处理器内核的初始化,然后
通过 bootmem_init()函数根据系统定义的 meminfo 结构进行内存结构的初始化,最后调用
paging_init()开启 MMU,创建内核页表,映射所有的物理内存和 IO空间。
2) 创建异常向量表和初始化中断处理函数;
3) 初始化系统核心进程调度器和时钟中断处理机制;
4) 初始化串口控制台(serial-console);
ARM-Linux 在初始化过程中一般都会初始化一个串口做为内核的控制台,这样内核在
启动过程中就可以通过串口输出信息以便开发者或用户了解系统的启动进程。
5) 创建和初始化系统 cache,为各种内存调用机制提供缓存,包括;动态内存分配,虚拟文
件系统(VirtualFile System)及页缓存。
6) 初始化内存管理,检测内存大小及被内核占用的内存情况;
7) 初始化系统的进程间通信机制(IPC);
当以上所有的初始化工作结束后,start_kernel()函数会调用 rest_init()函数来进行最后的
初始化,包括创建系统的第一个进程-init 进程来结束内核的启动。Init 进程首先进行一系
列的硬件初始化,然后通过命令行传递过来的参数挂载根文件系统。最后 init 进程会执行用
户传递过来的“init=”启动参数执行用户指定的命令,或者执行以下几个进程之一:
execve("/sbin/init",argv_init,envp_init);
execve("/etc/init",argv_init,envp_init);
execve("/bin/init",argv_init,envp_init);
execve("/bin/sh",argv_init,envp_init)。
当所有的初始化工作结束后,cpu_idle()函数会被调用来使系统处于闲置(idle)状态并
等待用户程序的执行。至此,整个 Linux 内核启动完毕