LINUX系统启动笔记
一 启动BIOS(仅PC机上有,嵌入式开发板上没有,BIOS,需要配置boardloader)
当你打开计算机电源,计算机会首先加载BIOS信息,BIOS信息是如此的重要,以至于计算机必须在最开始就找到它。这是因为BIOS中包含了CPU的相关信息、设备启动顺序信息、硬盘信息、内存信息、时钟信息、PnP特性等等。在此之后,计算机心里就有谱了,知道应该去读取哪个硬件设备了。
二 启动Boardloader
众所周知,硬盘上第0磁道第一个扇区被称为MBR,也就是Master Boot Record,即主引导记录,它的大小是512字节,别看地方不大,可里面却存放了预启动信息、分区表信息。
系统找到BIOS所指定的硬盘的MBR后,就会将其复制到0×7c00地址所在的物理内存中。其实被复制到物理内存的内容就是Boot Loader,而具体到你的电脑,那就是lilo或者grub了。
Setup函数执行阶段:
Setup()是汇编语言函数代码,它在内核的编译链接过程中被放到内核的引导装入程序之后,也就是内核映像文件的偏移量0x200地址处,实际物理地址0x00090200开始的RAM 中。因为内核不依赖于BIOS, 虽然BIOS已经初始化了大部分硬件设备,但Linux系统还要以自己的方式重新初始化设备,以增加可移植性和健壮性。还要注意的是,内核是工作在保护模式下的。总的来说,setup()函数的作用就是初始化计算机中的硬件设备,并为内核程序的执行建立环境。比如,检查系统中可用的RAM 数量、设置键盘重复延时速率、显卡等其他设备的检查,以及初始化和切换实模式到保护模式等。最后,系统执行跳到startup_ 32汇编函数上
三 加载内核
1. Startup_32函数的执行阶段
在系统的启动过程中有两个startup_320()函数,即位于arch/i386/boot/compressed/head.S文件中实现的。就是在setup()函数结束以后,该函数就被移动到物理地址0X00100000或0x00001000处,这取决于内核映像是被装到RAM 的高位还是底位。因为内核映像文件在编译连接时所产生的大小不同, 如zImage和bzImage大小相差很大,在装载解压时所使用的缓冲区也不同,所以他们所处的物理地址是不同的。不过解压后的映像最终都处在物理地址0x00100000开始的位置。然后跳转到这个地址处执行解压后的映像中的另一个startup_32()函数,这个函数为第一个Linux进程(进程0)建立执行环境,该函数初始化段寄存器、为进程0建立内核态堆栈等一系列活动。最后识别处理器模式,并跳转到start_kernel()函数。将Linux内核的映像装入内存,并且setup()函数做了一些必要的准备,就该startup_32函数开始干活了。CPU通过一条长程转移指令转到映像代码段开头的入口startup_32处,对于SMP结构的系统来说,这个时候运行的只是其中的一个处理器,就是所谓的主CPU。其他的次CPU处于停机状态, 等待主CPU 的启动。次CPU在受到启动进入内核时,同样也要从startup_32开始执行,所以从startup_32开始的代码是公共的。但有些操作仅由主CPU来执行,另一些操作由次CPU执行, 这并不意味着主CPU 和次CPU 并发地执行这段程序。实际上,主CPU 是开路先锋,首先执行这段程序,完成以后逐个启动次CPU执行,并且等待其完成。所以,在同一时间系统中最多只有一个处理器在执行这段程序。不管是主CPU还是次CPU,进入startup_32时都运行在保护模式下的段式寻址方式,等到第二个startup_32函数执行到最后时, 就开始执行start_kernel函数。
2. Start_kernel函数执行阶段
到了这个阶段才是真正的内核初始化阶段,几乎内核每个部分的初始化工作都是由这个函数来完成,如页表的初始化、系统日期和时间的初始化等。从某种意义上说,函数Start_kernel就好像一般可执行程序中的主函数main(),系统在进入这个函数之前已经进行了一些最底限度的初始化,为这个函数的执行建立起了一个环境,创造了必要的条件。当然,这个函数还要继续进行内核的初始化,甚至可以说内核的初始化在这里才真正开始,但它是较高层次的初始化。这个函数的代码在init/main.C中,从现在开始初始化流程不与CPU 类型和系统启动;方式相关了。此时系统运行在CPU的特权级,也就是我们常说的内
核模式下。start_ kernel函数主要完成一些数据结构的初始化,主要包括
如下:
printk(linux_banner) 输出
Linux版本信息;
Setup_arch()(arch/i386/kernel/traps.C)执行与体系结构相关的设置,如内存分析分配内
核页表, 处理启动命令行等;
Trap_init() 设置各种人口地址,如异常事件处理程序入口, 系统调用人口,
IniLIRQ() 初始化IRQ 中断处理机制;
Sched_init() 设置并启动第一个进程ini_task0 l
Softirq_init() 对软中断子系统进行初始化;
Time_initO 读取实时时间,重新设置时钟中断irq0的中断服务程序入口等;
Console__init() 初始化控制台和显示器;
Init_modules() 初始化
kernel__m odule l
Kmem_cache_init0 对内存的slab分配机制初始化{
Mem_init() 虚拟内存计算以及初始化;
Kmem_cache_size_jnit() 初始化slab分配器中的内部cashe和全局cashel
Fork_init() 定义了系统的最大进程数目。此外,还有一些对其他支持的初始化。
随后,进入reset—init0函数调用kernel__thread()函数为进程1创建init内核线程,这个内核线程又会创建其他的内核线程程序,并执行/sbin/init程序。此后start_kernel进入一个空闲等待循环(cpu_idle()), 使用系统初始化后CPU 的空闲时间片,init内核线程首先要锁定内核,然后调用do_basic_setup()来初始化外部设备及加载驱动程序。在do_basic_setup()函数调用完之后,init()函数会释放初始化函数所用的内存,并且打开/dev/console设备重新定向控制台,使用系统调用execve来执行用户态程序/sbin/init。
到目前为止,Linux内核的初始化工作完成,此时系统中已经存在5个运行实体:init线程、kflushd核心线程、kupdate核心线程、kswapd核心线程和keventd核心线程。本身所在的执行体其实就是一个线程,不过是由手工创建的。它在创建了init0线程以后就进入cpu_idle循环, 不会在进程列表中出现。如果使用pstree命令,则不能列出该线程。
最后,init程序会根据inittab文件中的设置信息启动相应的用户程序。当init得到控制并启动mingetty显示登录界面及提示后,系统启动完成。
四 用户层init依据inittab文件来设定运行等级
init的进程号是1,从这一点就能看出,init进程是系统所有进程的起点,Linux在完成核内引导以后,就开始运行init程序,。init程序需要读取配置文件/etc/inittab。inittab是一个不可执行的文本文件,它有若干行指令所组成。在Redhat系统中,inittab的内容如下所示(以“###"开始的中注释为笔者增加的):
id:runlevel:action:process
#
# inittab This file describes how the INIT process should set up
# the system in a certain run-level.
#
# Author: Miquel van Smoorenburg,
# Modified for RHS Linux by Marc Ewing and Donnie Barnes
#
# Default runlevel. The runlevels used by RHS are:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
###表示当前缺省运行级别为5(initdefault);
id:5:initdefault:
###启动时自动执行/etc/rc.d/rc.sysinit脚本(sysinit)
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit
l0:0:wait:/etc/rc.d/rc 0
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
###当运行级别为5时,以5为参数运行/etc/rc.d/rc脚本,init将等待其返回(wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6
###在启动过程中允许按CTRL-ALT-DELETE重启系统
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now
# When our UPS tells us power has failed, assume we have a few minutes
# of power left. Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"
# If power was restored before the shutdown kicked in, cancel it.
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"
###在2、3、4、5级别上以ttyX为参数执行/sbin/mingetty程序,打开ttyX终端用于用户登录,
###如果进程退出则再次运行mingetty程序(respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
###在5级别上运行xdm程序,提供xdm图形方式登录界面,并在退出时重新执行(respawn)
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon
以上面的inittab文件为例,来说明一下inittab的格式。其中以#开始的行是注释行,除了注释行之外,每一行都有以下格式:
id:runlevel:action:process
对上面各项的详细解释如下:
1. id
id是指入口标识符,它是一个字符串,对于getty或mingetty等其他login程序项,要求id与tty的编号相同,否则getty程序将不能正常工作。
2. runlevel
runlevel是init所处于的运行级别的标识,一般使用0-6以及S或s。0、1、6运行级别被系统保留:其中0作为shutdown动作,1作为重启至单用户模式,6为重启;S和s意义相同,表示单用户模式,且无需inittab文件,因此也不在inittab中出现,实际上,进入单用户模式时,init直接在控制台(/dev/console)上运行/sbin/sulogin。在一般的系统实现中,都使用了2、3、4、5几个级别,在Redhat系统中,2表示无NFS支持的多用户模式,3表示完全多用户模式(也是最常用的级别),4保留给用户自定义,5表示XDM图形登录方式。7-9级别也是可以使用的,传统的Unix系统没有定义这几个级别。runlevel可以是并列的多个值,以匹配多个运行级别,对大多数action来说,仅当runlevel与当前运行级别匹配成功才会执行。
3. action
action是描述其后的process的运行方式的。action可取的值包括:initdefault、sysinit、boot、bootwait等:
initdefault是一个特殊的action值,用于标识缺省的启动级别;当init由核心激活以后,它将读取inittab中的initdefault项,取得其中的runlevel,并作为当前的运行级别。如果没有inittab文件,或者其中没有initdefault项,init将在控制台上请求输入runlevel。
sysinit、boot、bootwait等action将在系统启动时无条件运行,而忽略其中的runlevel。
其余的action(不含initdefault)都与某个runlevel相关。各个action的定义在inittab的man手册中有详细的描述。
4. process
process为具体的执行程序。程序后面可以带参数。
第三部分:系统初始化
在init的配置文件中有这么一行:
si::sysinit:/etc/rc.d/rc.sysinit
它调用执行了/etc/rc.d/rc.sysinit,而rc.sysinit是一个bash shell的脚本,它主要是完成一些系统初始化的工作,rc.sysinit是每一个运行级别都要首先运行的重要脚本。它主要完成的工作有:激活交换分区,检查磁盘,加载硬件模块以及其它一些需要优先执行任务。
rc.sysinit约有850多行,但是每个单一的功能还是比较简单,而且带有注释,建议有兴趣的用户可以自行阅读自己机器上的该文件,以了解系统初始化所详细情况。由于此文件较长,所以不在本文中列出来,也不做具体的介绍。
当rc.sysinit程序执行完毕后,将返回init继续下一步。
第四部分:启动对应运行级别的守护进程
在rc.sysinit执行后,将返回init继续其它的动作,通常接下来会执行到/etc/rc.d/rc程序。以运行级别3为例,init将执行配置文件inittab中的以下这行:
l5:5:wait:/etc/rc.d/rc 5
这一行表示以5为参数运行/etc/rc.d/rc,/etc/rc.d/rc是一个Shell脚本,它接受5作为参数,去执行/etc/rc.d/rc5.d/目录下的所有的rc启动脚本,/etc/rc.d/rc5.d/目录中的这些启动脚本实际上都是一些链接文件,而不是真正的rc启动脚本,真正的rc启动脚本实际上都是放在/etc/rc.d/init.d/目录下。而这些rc启动脚本有着类似的用法,它们一般能接受start、stop、restart、status等参数。
/etc/rc.d/rc5.d/中的rc启动脚本通常是K或S开头的链接文件,对于以以S开头的启动脚本,将以start参数来运行。而如果发现存在相应的脚本也存在K打头的链接,而且已经处于运行态了(以/var/lock/subsys/下的文件作为标志),则将首先以stop为参数停止这些已经启动了的守护进程,然后再重新运行。这样做是为了保证是当init改变运行级别时,所有相关的守护进程都将重启。
至于在每个运行级中将运行哪些守护进程,用户可以通过chkconfig或setup中的"System Services"来自行设定。常见的守护进程有:
amd:自动安装NFS守护进程
apmd:高级电源管理守护进程
arpwatch:记录日志并构建一个在LAN接口上看到的以太网地址和IP地址对数据库
autofs:自动安装管理进程automount,与NFS相关,依赖于NIS
crond:Linux下的计划任务的守护进程
named:DNS服务器
netfs:安装NFS、Samba和NetWare网络文件系统
network:激活已配置网络接口的脚本程序
nfs:打开NFS服务
portmap:RPC portmap管理器,它管理基于RPC服务的连接
sendmail:邮件服务器sendmail
smb:Samba文件共享/打印服务
syslog:一个让系统引导时起动syslog和klogd系统日志守候进程的脚本
xfs:X Window字型服务器,为本地和远程X服务器提供字型集
Xinetd:支持多种网络服务的核心守护进程,可以管理wuftp、sshd、telnet等服务
这些守护进程也启动完成了,rc程序也就执行完了,然后又将返回init继续下一步。
第五部分:建立终端
rc执行完毕后,返回init。这时基本系统环境已经设置好了,各种守护进程也已经启动了。init接下来会打开6个终端,以便用户登录系统。通过按Alt+Fn(n对应1-6)可以在这6个终端中切换。在inittab中的以下6行就是定义了6个终端:
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
从上面可以看出在2、3、4、5的运行级别中都将以respawn方式运行mingetty程序,mingetty程序能打开终端、设置模式。同时它会显示一个文本登录界面,这个界面就是我们经常看到的登录界面,在这个登录界面中会提示用户输入用户名,而用户输入的用户将作为参数传给login程序来验证用户的身份。
第六部分:登录系统,启动完成
对于运行级别为5的图形方式用户来说,他们的登录是通过一个图形化的登录界面。登录成功后可以直接进入KDE、Gnome等窗口管理器。而本文主要讲的还是文本方式登录的情况:
当我们看到mingetty的登录界面时,我们就可以输入用户名和密码来登录系统了。
Linux的账号验证程序是login,login会接收mingetty传来的用户名作为用户名参数。然后login会对用户名进行分析:如果用户名不是root,且存在/etc/nologin文件,login将输出nologin文件的内容,然后退出。这通常用来系统维护时防止非root用户登录。只有/etc/securetty中登记了的终端才允许root用户登录,如果不存在这个文件,则root可以在任何终端上登录。/etc/usertty文件用于对用户作出附加访问限制,如果不存在这个文件,则没有其他限制。
在分析完用户名后,login将搜索/etc/passwd以及/etc/shadow来验证密码以及设置账户的其它信息,比如:主目录是什么、使用何种shell。如果没有指定主目录,将默认为根目录;如果没有指定shell,将默认为/bin/bash。
login程序成功后,会向对应的终端在输出最近一次登录的信息(在/var/log/lastlog中有记录),并检查用户是否有新邮件(在/usr/spool/mail/的对应用户名目录下)。然后开始设置各种环境变量:对于bash来说,系统首先寻找/etc/profile脚本文件,并执行它;然后如果用户的主目录中存在.bash_profile文件,就执行它,在这些文件中又可能调用了其它配置文件,所有的配置文件执行后后,各种环境变量也设好了,这时会出现大家熟悉的命令行提示符,到此整个启动过程就结束了。
五init进程执行rc.sysinit
六 启动内核模块
七 执行不同级别的脚本程序
八 执行/etc/rc.d/rc.local
九 执行/bin/login程序,进入登陆状态
遗留的问题:
在init初始化时,就执行一些shell脚本,但是SHELL是什么启动的,貌似是登陆以后才启动的。