剖析
Linux
系统启动过程
本文以
RedHat9.0
和
i386
平台为例,剖析了从用户打开电源直到屏幕出现命令行提示符的整个
Linux
启动过程。并且介绍了启动中涉及到的各种文件。
阅读
Linux
源代码,无疑是深入学习
Linux
的最好方法。在本文对
Linux
启动过程的介绍中,我们也尝试从源代码的视角来更深入的剖析
Linux
的启动过程,所以其中也简单涉及到部分相关的
Linux
源代码,
Linux
启动这部分的源码主要使用的是
C
语言,也涉及到了少量的汇编。而启动过程中也执行了大量的
shell(
主要是
bash shell)
所写脚本。为了方便读者阅读,笔者将整个
Linux
启动过程分成以下几个部分逐一介绍,大家可以参考下图:
当用户打开
PC
的电源,
BIOS
开机自检,按
BIOS
中设置的启动设备
(
通常是硬盘
)
启动,接着启动设备上安装的引导程序
lilo
或
grub
开始引导
Linux
,
Linux
首先进行内核的引导,接下来执行
init
程序,
init
程序调用了
rc.sysinit
和
rc
等程序,
rc.sysinit
和
rc
当完成系统初始化和运行服务的任务后,返回
init
;
init
启动了
mingetty
后,打开了终端供用户登录系统,用户登录成功后进入了
Shell
,这样就完成了从开机到登录的整个启动过程。
下面就将逐一介绍其中几个关键的部分:
第一部分:内核的引导
(
核内引导
)
Red Hat9.0
可以使用
lilo
或
grub
等引导程序开始引导
Linux
系统,当引导程序成功完成引导任务后,
Linux
从它们手中接管了
CPU
的控制权,然后
CPU
就开始执行
Linux
的核心映象代码,开始了
Linux
启动过程。这里使用了几个汇编程序来引导
Linux
,这一步泛及到
Linux
源代码树中的“
arch/i386/boot
”下的这几个文件:
bootsect.S
、
setup.S
、
video.S
等。
其中
bootsect.S
是生成引导扇区的汇编源码,它完成加载动作后直接跳转到
setup.S
的程序入口。
setup.S
的主要功能就是将系统参数(包括内存、磁盘等,由
BIOS
返回)拷贝到特别内存中,以便以后这些参数被保护模式下的代码来读取。此外,
setup.S
还将
video.S
中的代码包含进来,检测和设置显示器和显示模式。最后,
setup.S
将系统转换到保护模式,并跳转到
0x100000
。
那么
0x100000
这个内存地址中存放的是什么代码?而这些代码又是从何而来的呢?
0x100000
这个内存地址存放的是解压后的内核,因为
Red Hat
提供的内核包含了众多驱动和功能而显得比较大,所以在内核编译中使用了“
makebzImage
”方式,从而生成压缩过的内核,在
RedHat
中内核常常被命名为
vmlinuz
,在
Linux
的最初引导过程中,是通过
"arch/i386/boot/compressed/"
中的
head.S
利用
misc.c
中定义的
decompress_kernel()
函数,将内核
vmlinuz
解压到
0x100000
的。
当
CPU
跳到
0x100000
时,将执行
"arch/i386/kernel/head.S"
中的
startup_32
,它也是
vmlinux
的入口,然后就跳转到
start_kernel()
中去了。
start_kernel()
是
"init/main.c"
中的定义的函数,
start_kernel()
中调用了一系列初始化函数,以完成
kernel
本身的设置。
start_kernel()
函数中,做了大量的工作来建立基本的
Linux
核心环境。如果顺利执行完
start_kernel()
,则基本的
Linux
核心环境已经建立起来了。
在
start_kernel()
的最后,通过调用
init()
函数,系统创建第一个核心线程,启动了
init
过程。而核心线程
init()
主要是来进行一些外设初始化的工作的,包括调用
do_basic_setup()
完成外设及其驱动程序的加载和初始化。并完成文件系统初始化和
root
文件系统的安装。
当
do_basic_setup()
函数返回
init()
,
init()
又打开了
/dev/console
设备,重定向三个标准的输入输出文件
stdin
、
stdout
和
stderr
到控制台,最后,搜索文件系统中的
init
程序(或者由
init=
命令行参数指定的程序),并使用
execve()
系统调用加载执行
init
程序。到此
init()
函数结束,内核的引导部分也到此结束了,
第二部分:运行
init
init
的进程号是
1
,从这一点就能看出,
init
进程是系统所有进程的起点,
Linux
在完成核内引导以后,就开始运行
init
程序,。
init
程序需要读取配置文件
/etc/inittab
。
inittab
是一个不可执行的文本文件,它有若干行指令所组成。在
Redhat
系统中,
inittab
的内容如下所示
(
以“
###"
开始的中注释为笔者增加的
)
:
#
# inittab This file describes how the INIT process should set up
# the system in a certain run-level.
#
# Author: Miquel van Smoorenburg, <miquels@drinkel.nl.mugnet.org>
# Modified for RHS Linux by Marc Ewing and Donnie Barnes
#
# inittab This file describes how the INIT process should set up
# the system in a certain run-level.
#
# Author: Miquel van Smoorenburg, <miquels@drinkel.nl.mugnet.org>
# Modified for RHS Linux by Marc Ewing and Donnie Barnes
#
# Default runlevel. The runlevels used by RHS are:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
### 表示当前缺省运行级别为 5(initdefault) ;
id:5:initdefault:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
### 表示当前缺省运行级别为 5(initdefault) ;
id:5:initdefault:
###
启动时自动执行
/etc/rc.d/rc.sysinit
脚本
(sysinit)
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit
l0:0:wait:/etc/rc.d/rc 0
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
### 当运行级别为 5 时,以 5 为参数运行 /etc/rc.d/rc 脚本, init 将等待其返回 (wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
### 当运行级别为 5 时,以 5 为参数运行 /etc/rc.d/rc 脚本, init 将等待其返回 (wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6
###
在启动过程中允许按
CTRL-ALT-DELETE
重启系统
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now
# When our UPS tells us power has failed, assume we have a few minutes
# of power left. Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"
# of power left. Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"
# If power was restored before the shutdown kicked in, cancel it.
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"
###
在
2
、
3
、
4
、
5
级别上以
ttyX
为参数执行
/sbin/mingetty
程序,打开
ttyX
终端用于用户登录,
### 如果进程退出则再次运行 mingetty 程序 (respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
### 如果进程退出则再次运行 mingetty 程序 (respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
###
在
5
级别上运行
xdm
程序,提供
xdm
图形方式登录界面,并在退出时重新执行
(respawn)
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon
以上面的
inittab
文件为例,来说明一下
inittab
的格式。其中以
#
开始的行是注释行,除了注释行之外,每一行都有以下格式:
id:runlevel:action:process
对上面各项的详细解释如下:
1. id
id
是指入口标识符,它是一个字符串,对于
getty
或
mingetty
等其他
login
程序项,要求
id
与
tty
的编号相同,否则
getty
程序将不能正常工作。
2. runlevel
runlevel
是
init
所处于的运行级别的标识,一般使用
0
-
6
以及
S
或
s
。
0
、
1
、
6
运行级别被系统保留:其中
0
作为
shutdown
动作,
1
作为重启至单用户模式,
6
为重启;
S
和
s
意义相同,表示单用户模式,且无需
inittab
文件,因此也不在
inittab
中出现,实际上,进入单用户模式时,
init
直接在控制台(
/dev/console
)上运行
/sbin/sulogin
。在一般的系统实现中,都使用了
2
、
3
、
4
、
5
几个级别,在
Redhat
系统中,
2
表示无
NFS
支持的多用户模式,
3
表示完全多用户模式(也是最常用的级别),
4
保留给用户自定义,
5
表示
XDM
图形登录方式。
7
-
9
级别也是可以使用的,传统的
Unix
系统没有定义这几个级别。
runlevel
可以是并列的多个值,以匹配多个运行级别,对大多数
action
来说,仅当
runlevel
与当前运行级别匹配成功才会执行。
3. action
action
是描述其后的
process
的运行方式的。
action
可取的值包括:
initdefault
、
sysinit
、
boot
、
bootwait
等:
initdefault
是一个特殊的
action
值,用于标识缺省的启动级别;当
init
由核心激活以后,它将读取
inittab
中的
initdefault
项,取得其中的
runlevel
,并作为当前的运行级别。如果没有
inittab
文件,或者其中没有
initdefault
项,
init
将在控制台上请求输入
runlevel
。
sysinit
、
boot
、
bootwait
等
action
将在系统启动时无条件运行,而忽略其中的
runlevel
。
其余的
action
(不含
initdefault
)都与某个
runlevel
相关。各个
action
的定义在
inittab
的
man
手册中有详细的描述。
4. process
process
为具体的执行程序。程序后面可以带参数。
第三部分:系统初始化
在
init
的配置文件中有这么一行:
si::sysinit:/etc/rc.d/rc.sysinit
它调用执行了
/etc/rc.d/rc.sysinit
,而
rc.sysinit
是一个
bash shell
的脚本,它主要是完成一些系统初始化的工作,
rc.sysinit
是每一个运行级别都要首先运行的重要脚本。它主要完成的工作有:激活交换分区,检查磁盘,加载硬件模块以及其它一些需要优先执行任务。
rc.sysinit
约有
850
多行,但是每个单一的功能还是比较简单,而且带有注释,建议有兴趣的用户可以自行阅读自己机器上的该文件,以了解系统初始化所详细情况。由于此文件较长,所以不在本文中列出来,也不做具体的介绍。
当
rc.sysinit
程序执行完毕后,将返回
init
继续下一步。
第四部分:启动对应运行级别的守护进程
在
rc.sysinit
执行后,将返回
init
继续其它的动作,通常接下来会执行到
/etc/rc.d/rc
程序。以运行级别
3
为例,
init
将执行配置文件
inittab
中的以下这行:
l5:5:wait:/etc/rc.d/rc 5
这一行表示以
5
为参数运行
/etc/rc.d/rc
,
/etc/rc.d/rc
是一个
Shell
脚本,它接受
5
作为参数,去执行
/etc/rc.d/rc5.d/
目录下的所有的
rc
启动脚本,
/etc/rc.d/rc5.d/
目录中的这些启动脚本实际上都是一些链接文件,而不是真正的
rc
启动脚本,真正的
rc
启动脚本实际上都是放在
/etc/rc.d/init.d/
目录下。而这些
rc
启动脚本有着类似的用法,它们一般能接受
start
、
stop
、
restart
、
status
等参数。
/etc/rc.d/rc5.d/
中的
rc
启动脚本通常是
K
或
S
开头的链接文件,对于以以
S
开头的启动脚本,将以
start
参数来运行。而如果发现存在相应的脚本也存在
K
打头的链接,而且已经处于运行态了
(
以
/var/lock/subsys/
下的文件作为标志
)
,则将首先以
stop
为参数停止这些已经启动了的守护进程,然后再重新运行。这样做是为了保证是当
init
改变运行级别时,所有相关的守护进程都将重启。
至于在每个运行级中将运行哪些守护进程,用户可以通过
chkconfig
或
setup
中的
"System Services"
来自行设定。常见的守护进程有:
amd
:自动安装
NFS
守护进程
apmd: 高级电源管理守护进程
arpwatch :记录日志并构建一个在 LAN 接口上看到的以太网地址和 IP 地址对数据库
autofs :自动安装管理进程 automount ,与 NFS 相关,依赖于 NIS
crond : Linux 下的计划任务的守护进程
named : DNS 服务器
netfs :安装 NFS 、 Samba 和 NetWare 网络文件系统
network :激活已配置网络接口的脚本程序
nfs :打开 NFS 服务
portmap : RPC portmap 管理器,它管理基于 RPC 服务的连接
sendmail :邮件服务器 sendmail
smb : Samba 文件共享 / 打印服务
syslog :一个让系统引导时起动 syslog 和 klogd 系统日志守候进程的脚本
xfs : X Window 字型服务器,为本地和远程 X 服务器提供字型集
Xinetd :支持多种网络服务的核心守护进程,可以管理 wuftp 、 sshd 、 telnet 等服务
apmd: 高级电源管理守护进程
arpwatch :记录日志并构建一个在 LAN 接口上看到的以太网地址和 IP 地址对数据库
autofs :自动安装管理进程 automount ,与 NFS 相关,依赖于 NIS
crond : Linux 下的计划任务的守护进程
named : DNS 服务器
netfs :安装 NFS 、 Samba 和 NetWare 网络文件系统
network :激活已配置网络接口的脚本程序
nfs :打开 NFS 服务
portmap : RPC portmap 管理器,它管理基于 RPC 服务的连接
sendmail :邮件服务器 sendmail
smb : Samba 文件共享 / 打印服务
syslog :一个让系统引导时起动 syslog 和 klogd 系统日志守候进程的脚本
xfs : X Window 字型服务器,为本地和远程 X 服务器提供字型集
Xinetd :支持多种网络服务的核心守护进程,可以管理 wuftp 、 sshd 、 telnet 等服务
这些守护进程也启动完成了,
rc
程序也就执行完了,然后又将返回
init
继续下一步。
第五部分:建立终端
rc
执行完毕后,返回
init
。这时基本系统环境已经设置好了,各种守护进程也已经启动了。
init
接下来会打开
6
个终端,以便用户登录系统。通过按
Alt+Fn(n
对应
1-6)
可以在这
6
个终端中切换。在
inittab
中的以下
6
行就是定义了
6
个终端:
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
从上面可以看出在
2
、
3
、
4
、
5
的运行级别中都将以
respawn
方式运行
mingetty
程序,
mingetty
程序能打开终端、设置模式。同时它会显示一个文本登录界面,这个界面就是我们经常看到的登录界面,在这个登录界面中会提示用户输入用户名,而用户输入的用户将作为参数传给
login
程序来验证用户的身份。
第六部分:登录系统,启动完成
对于运行级别为
5
的图形方式用户来说,他们的登录是通过一个图形化的登录界面。登录成功后可以直接进入
KDE
、
Gnome
等窗口管理器。而本文主要讲的还是文本方式登录的情况:
当我们看到
mingetty
的登录界面时,我们就可以输入用户名和密码来登录系统了。
Linux
的账号验证程序是
login
,
login
会接收
mingetty
传来的用户名作为用户名参数。然后
login
会对用户名进行分析:如果用户名不是
root
,且存在
/etc/nologin
文件,
login
将输出
nologin
文件的内容,然后退出。这通常用来系统维护时防止非
root
用户登录。只有
/etc/securetty
中登记了的终端才允许
root
用户登录,如果不存在这个文件,则
root
可以在任何终端上登录。
/etc/usertty
文件用于对用户作出附加访问限制,如果不存在这个文件,则没有其他限制。
在分析完用户名后,
login
将搜索
/etc/passwd
以及
/etc/shadow
来验证密码以及设置账户的其它信息,比如:主目录是什么、使用何种
shell
。如果没有指定主目录,将默认为根目录;如果没有指定
shell
,将默认为
/bin/bash
。
login
程序成功后,会向对应的终端在输出最近一次登录的信息
(
在
/var/log/lastlog
中有记录
)
,并检查用户是否有新邮件
(
在
/usr/spool/mail/
的对应用户名目录下
)
。然后开始设置各种环境变量:对于
bash
来说,系统首先寻找
/etc/profile
脚本文件,并执行它;然后如果用户的主目录中存在
.bash_profile
文件,就执行它,在这些文件中又可能调用了其它配置文件,所有的配置文件执行后后,各种环境变量也设好了,这时会出现大家熟悉的命令行提示符,到此整个启动过程就结束了。
希望通过上面对
Linux
启动过程的剖析能帮助那些想深入学习
Linux
用户建立一个相关
Linux
启动过程的清晰概念,进而可以进一步研究
Linux
接下来是如何工作的。