Linux启动过程_linux自举介绍-CSDN博客

Linux启动过程（转）

关于Windows启动过程介绍的文章可谓多如牛毛，而对于Linux的介绍却是凤毛麟角。凡是曾经使用过Linux的用户可能都会注意到，当计算机启动时，屏幕上会出现很多信息。一般情况下，这些信息我们可以通过以下的命令看到：

cat /var/log/dmesg | more

这些信息究竟有什么含义？这个问题看起来似乎很容易回答，因为只要在Linux参考书里查找一下，就会找出一个类似于这样的答案：“这是一些内核启动信息……”。但是“内核启动信息”到底是什么意思呢？

要想对Linux内部工作有所了解，就必须要对Linux内核的体系结构有一个全面的了解。下面我们就去揭开它的秘密。在此，我不想解释Linux内核的体系结构，只想解释（或者说是试图去解释）计算机系统启动进程中一些最基本的概念。这里所说的启动过程是指从按下开关到提示符出现的整个过程。

启动指的是什么

          在操作系统的词汇里，启动是指通过处理器执行一些指令，把操作系统的一部分放入到主存中。在启动过程中，Linux内部的数据结构会被初始化，会被赋给一些初始值，并且某些进程会被创建。因为当计算机电源打开时，所有的硬件设备都处于一种不可预知的状态，内存也处于一种不活动的随机状态，所以，计算机的启动过程可以说是一个长且复杂的任务。因此，我们必须知道，之所以叫“启动”主要是因为计算机体系结构的原因。

          在此提请读者注意：

          1.对计算机内部的工作和内核的操作有一个基本的了解，对自己非常有益。

          2.这篇文章中提到的所有文件，指的都是Linux内核2.4.2-2版本里的文件。这些文件对于所有的Linux内核来说都是相同的，并且可以在任何一个Linux系统里找到它们，此处我使用的是Red Hat 7.1。

          3.在本文里，讨论范围限于IBM PC体系结构。

BIOS及其功能

          当计算机打开电源时，内存里包含的是一些随机的数据，所有的东西都没有被初始化，操作系统也没有被加载。开始整个启动过程的是一个特殊的硬件电路，它触发CPU的Reset脚的逻辑值。然后，一些CPU的寄存器比如CS（一个分段寄存器：代码段寄存器，它指向含有程序指令的段），eip（在执行指令过程中，当CPU检测到一个意外事故发生时，它会做出三种类型的判断：错误、陷阱、中止，这取决于eip寄存器的值，它存储在内核模块栈里）就会被给定一个值。接着，物理地址为0xfffffff0的代码将被执行。这个地址被存储在一个只读存储器（ROM）里。BIOS（基本输入/输出系统）实际上是一段存储在ROM里的程序。它包含了一系列可以被某些操作系统调用，用于处理计算机各种硬件设备的中断驱动和低级程序。其中微软的DOS就是这样的一种操作系统。

         Linux是否使用附于计算机系统的BIOS来初始化硬件设备？或者说，是否有其它的东西来完成同样的任务？不过这个问题没有那么简单，必须要了解一些知识。我们从80386模式开始。Intel微处理器实现地址翻译（从逻辑地址->线性地址->物理地址）有两种不同的途径，分别称作实模式和保护模式。实模式存在主要是为了使得处理器可以和较老的处理相兼容。事实上，所有的BIOS程序都是在实模式下运行的。但是，Linux内核是在保护模式下运行，而不是在实模式下。因此，一旦初始化完成后，Linux就不再使用BIOS，而是完全由自己来为计算机上的所有硬件提供驱动程序（这点和DOS是不一样的）。

          那么什么时候Linux使用保护模式？为什么BIOS不能使用相同的模式？BIOS使用实模式是因为其在操作过程中使用的是实模式地址，并且在计算机刚打开电源时，只有实模式地址可用。一个实模式地址由段地址和偏移地址组成，因此，相应的物理地址就为段地址×（2×8）+偏移。

          那么，这是不是意味着在整个启动过程中，Linux就从来不使用BIOS了呢？答案是否定的。在启动阶段，Linux从硬盘或者其它外部设备加载内核时，需要使用BIOS。

          让我们来看一下启动时BIOS主要做了哪些操作：

          1.BIOS要对硬件进行一系列彻底的检测。这个步骤主要是检查系统安装有哪些设备,以及它们工作是否正常。通常把这个步骤叫做自检（Power-On Self-Test,POST），这时会显示版本及其它很多相关的硬件信息。

          2.BIOS要对硬件进行初始化。这一步非常重要，因为它要保证所有的硬件设备在IRQ（中断请求）和I/O端口操作时都没有冲突。等这步完成以后，它会显示一个已经安装的PCI设备表。

          3.接着到了操作系统，BIOS将查找一个可以引导的操作系统。这取决于BIOS的设置，它可以从软盘、硬盘或者光盘启动。

          4.一旦发现一个合法的设备，BIOS就会把其第一扇区的内容复制到物理地址，即从0x00007c00开始的内存中，然后跳至刚加载的地址并执行之。

到此为止，BIOS所要做的工作就全部完成了。

自举程序及其功用

          BIOS调用一个专门的程序，这个程序的任务就是把操作系统的内核调入内存。这个程序就叫做自举程序（Boot Loader）。在我们继续下面内容之前，先来看一下启动系统的不同途径。

          1.从软盘启动Linux

          从软盘启动时，存储在软盘第一扇区的指令将被加载并执行。这个指令然后就会把其余的内核复制到内存中。

           Linux内核可以装在1.44MB的软盘里，不过为了减少磁盘占用量，它们都进行了压缩。这个压缩过程是在编译时完成的，而解压缩的过程则由自举程序完成。

          从软盘启动Linux时，自举程序要做的工作非常简单。它是一个位于/usr/src/linux-2.4.2/arch/i386/boot/bootsect.S的汇编语言文件。当我们编译Linux内核源代码，或者获取一个新的内核时，这个可执行的汇编代码就会被放在内核程序的前端。由此可见，要制作一个可启动的Linux软盘其实很简单。我们只要从磁盘的第一个扇区拷贝Linux内核，就可以创建一个可启动软盘。当BIOS加载软盘的第一个扇区时，它实际上拷贝的是自举程序。自举程序由BIOS调用（跳到物理地址为0x00007c00的位置），然后执行以下的操作：

          (1)把自已从地址0x00007c00移动到0x00090000；

          (2)使用地址0x00003ff4，创建“实模式”栈；

          (3)设置磁盘参数表，这里使用的是BIOS提供的软盘驱动程序；

          (4)通过调用BIOS程序显示“Loading”信息；

          (5)自举程序调用BIOS程序来加载软盘上内核的setup()函数，并把它放在起始地址为0x00090200的内存中；

          (6)接下来自举程序调用一个BIOS程序，这个程序从软盘加载剩余的内核程序，并将其放入起始地址为0x00010000（所谓的低地址）或者0x00100000（所谓的高地址）；

          (7)然后，跳转到setup()函数。

          2.从硬盘启动Linux

          当系统从硬盘启动时，启动过程又有所不同。硬盘的第一个扇区叫做MBR（Master Boot Record），其上存储着分区表和一个小程序。这个程序加载存储由操作系统的第一扇区来开始启动。Linux是一个高度灵活且非常优秀的软件，所以在MBR里，它使用一个叫做LILO的程序来代替上述的那个程序。LILO允许用户选择所要启动的操作系统。

          一般来说，Linux是从硬盘启动的。这就需要不同的自举程序。在Intel系统里，用得最多的自举程序就是LILO。对于其它的体系结构，还存在着别的自举程序。LILO可以安装在MBR上（请注意：在安装Red Hat Linux时，有一个步骤会让用户选择把LILO安装到MBR或者引导扇区）或一个活动分区的引导扇区上。

          由于LILO太大，MBR无法容纳，所以它被分成两部分。MBR（或者磁盘分区的引导扇区）包含有一个小的自举程序，它被BIOS载入到起始地址为0x00007c00的内存中。然后，这个小程序再把自己移到0x0009a000地址处，接着设置实模式栈，最后加载第二部分的LILO自举程序（请注意：实模式栈地址范围是0x0009b000 到 0x0009a200）。

          第二部分的LILO会从磁盘读取所有可用的操作系统，并且给用户列出，以选择所要启动的系统。一旦用户选择完成，自举程序就会加载相应的扇区内容到内存中并且执行之。

          自举程序被BIOS调用时（跳到物理地址为0x00007c00处），要执行以下操作：

          (1)把自已从地址0x00007c00移动到0x00090000；

          (2)使用地址0x00003ff4，创建“实模式”栈；

          (3)设置磁盘参数表。这里使用的是BIOS提供的软盘驱动程序；

          (4)通过调用BIOS程序显示“Loading Linux”信息；

          (5)自举程序调用BIOS程序来加载软盘上内核的setup()函数，并把它放在起始地址为0x00090200的内存中；

          (6)接下来自举程序调用一个BIOS程序，这个程序从软盘加载剩余的内核程序，并将其放入起始地址为0x00010000或者0x00100000；

          (7)然后，跳转到setup()函数。

剖析Linux系统启动过程

本文以RedHat9.0和i386平台为例，剖析了从用户打开电源直到屏幕出现命令行提示符的整个Linux启动过程。并且介绍了启动中涉及到的各种文件。

阅读Linux源代码，无疑是深入学习Linux的最好方法。在本文对Linux启动过程的介绍中，我们也尝试从源代码的视角来更深入的剖析Linux的启动过程，所以其中也简单涉及到部分相关的Linux源代码，inux启动这部分的源码主要使用的是C语言，也涉及到了少量的汇编。而启动过程中也执行了大量的shell(主要是bash shell)所写脚本。为了方便读者阅读，笔者将整个Linux启动过程分成以下几个部分逐一介绍，大家可以参考下图：

当用户打开PC的电源，BIOS开机自检，按BIOS中设置的启动设备(通常是硬盘)启动，接着启动设备上安装的引导程序lilo或grub开始引导Linux，Linux首先进行内核的引导，接下来执行init程序，init程序调用了rc.sysinit和rc等程序，rc.sysinit和rc当完成系统初始化和运行服务的任务后，返回init；init启动了mingetty后，打开了终端供用户登录系统，用户登录成功后进入了Shell，这样就完成了从开机到登录的整个启动过程。

下面就将逐一介绍其中几个关键的部分：

第一部分：内核的引导(核内引导)

Red Hat9.0可以使用lilo或grub等引导程序开始引导Linux系统，当引导程序成功完成引导任务后，Linux从它们手中接管了CPU的控制权，然后CPU就开始执行Linux的核心映象代码，开始了Linux启动过程。这里使用了几个汇编程序来引导Linux，这一步泛及到Linux源代码树中的“arch/i386/boot”下的这几个文件：bootsect.S、setup.S、video.S等。

其中bootsect.S是生成引导扇区的汇编源码，它完成加载动作后直接跳转到setup.S的程序入口。setup.S的主要功能就是将系统参数（包括内存、磁盘等，由BIOS返回）拷贝到特别内存中，以便以后这些参数被保护模式下的代码来读取。此外，setup.S还将video.S中的代码包含进来，检测和设置显示器和显示模式。最后，setup.S将系统转换到保护模式，并跳转到 0x100000。

那么0x100000这个内存地址中存放的是什么代码？而这些代码又是从何而来的呢？

0x100000这个内存地址存放的是解压后的内核，因为Red Hat提供的内核包含了众多驱动和功能而显得比较大，所以在内核编译中使用了“makebzImage”方式，从而生成压缩过的内核，在RedHat中内核常常被命名为vmlinuz，在Linux的最初引导过程中，是通过"arch/i386/boot/compressed/"中的head.S利用misc.c中定义的decompress_kernel()函数，将内核vmlinuz解压到0x100000的。

当CPU跳到0x100000时，将执行"arch/i386/kernel/head.S"中的startup_32，它也是vmlinux的入口，然后就跳转到start_kernel()中去了。start_kernel()是"init/main.c"中的定义的函数，start_kernel()中调用了一系列初始化函数，以完成kernel本身的设置。start_kernel()函数中，做了大量的工作来建立基本的Linux核心环境。如果顺利执行完start_kernel()，则基本的Linux核心环境已经建立起来了。

在start_kernel()的最后，通过调用init()函数，系统创建第一个核心线程，启动了init过程。而核心线程init()主要是来进行一些外设初始化的工作的，包括调用do_basic_setup()完成外设及其驱动程序的加载和初始化。并完成文件系统初始化和root文件系统的安装。

当do_basic_setup()函数返回init()，init()又打开了/dev/console设备，重定向三个标准的输入输出文件stdin、stdout和stderr到控制台，最后，搜索文件系统中的init程序（或者由init=命令行参数指定的程序），并使用 execve()系统调用加载执行init程序。到此init()函数结束，内核的引导部分也到此结束了，

第二部分：运行init

init的进程号是1，从这一点就能看出，init进程是系统所有进程的起点，Linux在完成核内引导以后，就开始运行init程序，。init程序需要读取配置文件/etc/inittab。inittab是一个不可执行的文本文件，它有若干行指令所组成。在Redhat系统中，inittab的内容如下所示(以“###"开始的中注释为笔者增加的)：

　　#
# inittab       This file describes how the INIT process should set up
#               the system in a certain run-level.
#
# Author:       Miquel van Smoorenburg,
#               Modified for RHS Linux by Marc Ewing and Donnie Barnes
#

　　# Default runlevel. The runlevels used by RHS are:
#   0 - halt (Do NOT set initdefault to this)
#   1 - Single user mode
#   2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
#   3 - Full multiuser mode
#   4 - unused
#   5 - X11
#   6 - reboot (Do NOT set initdefault to this)
#
###表示当前缺省运行级别为5(initdefault)；
id:5:initdefault:

###启动时自动执行/etc/rc.d/rc.sysinit脚本(sysinit)
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit

l0:0:wait:/etc/rc.d/rc 0
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
###当运行级别为5时，以5为参数运行/etc/rc.d/rc脚本，init将等待其返回(wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6

###在启动过程中允许按CTRL-ALT-DELETE重启系统
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now

# When our UPS tells us power has failed, assume we have a few minutes
# of power left. Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"

# If power was restored before the shutdown kicked in, cancel it.
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"

###在2、3、4、5级别上以ttyX为参数执行/sbin/mingetty程序，打开ttyX终端用于用户登录，
###如果进程退出则再次运行mingetty程序(respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6

###在5级别上运行xdm程序，提供xdm图形方式登录界面，并在退出时重新执行(respawn)
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon

以上面的inittab文件为例，来说明一下inittab的格式。其中以#开始的行是注释行，除了注释行之外，每一行都有以下格式：

　　id:runlevel:action:process

对上面各项的详细解释如下：

1. id

id是指入口标识符，它是一个字符串，对于getty或mingetty等其他login程序项，要求id与tty的编号相同，否则getty程序将不能正常工作。

2. runlevel

runlevel是init所处于的运行级别的标识，一般使用0－6以及S或s。0、1、6运行级别被系统保留：其中0作为shutdown动作，1作为重启至单用户模式，6为重启；S和s意义相同，表示单用户模式，且无需inittab文件，因此也不在inittab中出现，实际上，进入单用户模式时，init直接在控制台（/dev/console）上运行/sbin/sulogin。在一般的系统实现中，都使用了2、3、4、5几个级别，在Redhat系统中，2表示无NFS支持的多用户模式，3表示完全多用户模式（也是最常用的级别），4保留给用户自定义，5表示XDM图形登录方式。7－9级别也是可以使用的，传统的Unix系统没有定义这几个级别。runlevel可以是并列的多个值，以匹配多个运行级别，对大多数action来说，仅当runlevel与当前运行级别匹配成功才会执行。

3. action

action是描述其后的process的运行方式的。action可取的值包括：initdefault、sysinit、boot、bootwait等：

initdefault是一个特殊的action值，用于标识缺省的启动级别；当init由核心激活以后，它将读取inittab中的initdefault项，取得其中的runlevel，并作为当前的运行级别。如果没有inittab文件，或者其中没有initdefault项，init将在控制台上请求输入runlevel。

sysinit、boot、bootwait等action将在系统启动时无条件运行，而忽略其中的runlevel。

其余的action（不含initdefault）都与某个runlevel相关。各个action的定义在inittab的man手册中有详细的描述。

4. process

process为具体的执行程序。程序后面可以带参数。

第三部分：系统初始化

在init的配置文件中有这么一行：

si::sysinit:/etc/rc.d/rc.sysinit

它调用执行了/etc/rc.d/rc.sysinit，而rc.sysinit是一个bash shell的脚本，它主要是完成一些系统初始化的工作，rc.sysinit是每一个运行级别都要首先运行的重要脚本。它主要完成的工作有：激活交换分区，检查磁盘，加载硬件模块以及其它一些需要优先执行任务。

rc.sysinit约有850多行，但是每个单一的功能还是比较简单，而且带有注释，建议有兴趣的用户可以自行阅读自己机器上的该文件，以了解系统初始化所详细情况。由于此文件较长，所以不在本文中列出来，也不做具体的介绍。

当rc.sysinit程序执行完毕后，将返回init继续下一步。

第四部分：启动对应运行级别的守护进程

在rc.sysinit执行后，将返回init继续其它的动作，通常接下来会执行到/etc/rc.d/rc程序。以运行级别3为例，init将执行配置文件inittab中的以下这行：

l5:5:wait:/etc/rc.d/rc 5

这一行表示以5为参数运行/etc/rc.d/rc，/etc/rc.d/rc是一个Shell脚本，它接受5作为参数，去执行/etc/rc.d/rc5.d/目录下的所有的rc启动脚本，/etc/rc.d/rc5.d/目录中的这些启动脚本实际上都是一些链接文件，而不是真正的rc启动脚本，真正的rc启动脚本实际上都是放在/etc/rc.d/init.d/目录下。而这些rc启动脚本有着类似的用法，它们一般能接受start、stop、restart、status等参数。

/etc/rc.d/rc5.d/中的rc启动脚本通常是K或S开头的链接文件，对于以以S开头的启动脚本，将以start参数来运行。而如果发现存在相应的脚本也存在K打头的链接，而且已经处于运行态了(以/var/lock/subsys/下的文件作为标志)，则将首先以stop为参数停止这些已经启动了的守护进程，然后再重新运行。这样做是为了保证是当init改变运行级别时，所有相关的守护进程都将重启。

至于在每个运行级中将运行哪些守护进程，用户可以通过chkconfig或setup中的"System Services"来自行设定。常见的守护进程有：

amd：自动安装NFS守护进程
apmd:高级电源管理守护进程
arpwatch：记录日志并构建一个在LAN接口上看到的以太网地址和IP地址对数据库
autofs：自动安装管理进程automount，与NFS相关，依赖于NIS
crond：Linux下的计划任务的守护进程
named：DNS服务器
netfs：安装NFS、Samba和NetWare网络文件系统
network：激活已配置网络接口的脚本程序
nfs：打开NFS服务
portmap：RPC portmap管理器，它管理基于RPC服务的连接
sendmail：邮件服务器sendmail
smb：Samba文件共享/打印服务
syslog：一个让系统引导时起动syslog和klogd系统日志守候进程的脚本
xfs：X Window字型服务器，为本地和远程X服务器提供字型集
Xinetd：支持多种网络服务的核心守护进程，可以管理wuftp、sshd、telnet等服务

这些守护进程也启动完成了，rc程序也就执行完了，然后又将返回init继续下一步。

第五部分：建立终端

rc执行完毕后，返回init。这时基本系统环境已经设置好了，各种守护进程也已经启动了。 init接下来会打开6个终端，以便用户登录系统。通过按Alt+Fn(n对应1-6)可以在这6个终端中切换。在inittab中的以下6行就是定义了6个终端：

1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6

从上面可以看出在2、3、4、5的运行级别中都将以respawn方式运行mingetty程序，mingetty程序能打开终端、设置模式。同时它会显示一个文本登录界面，这个界面就是我们经常看到的登录界面，在这个登录界面中会提示用户输入用户名，而用户输入的用户将作为参数传给login程序来验证用户的身份。

第六部分：登录系统，启动完成

对于运行级别为5的图形方式用户来说，他们的登录是通过一个图形化的登录界面。登录成功后可以直接进入KDE、Gnome等窗口管理器。而本文主要讲的还是文本方式登录的情况：

当我们看到mingetty的登录界面时，我们就可以输入用户名和密码来登录系统了。

Linux的账号验证程序是login，login会接收mingetty传来的用户名作为用户名参数。然后login会对用户名进行分析：如果用户名不是root，且存在/etc/nologin文件，login将输出nologin文件的内容，然后退出。这通常用来系统维护时防止非root用户登录。只有/etc/securetty中登记了的终端才允许root用户登录，如果不存在这个文件，则root可以在任何终端上登录。/etc/usertty文件用于对用户作出附加访问限制，如果不存在这个文件，则没有其他限制。

在分析完用户名后，login将搜索/etc/passwd以及/etc/shadow来验证密码以及设置账户的其它信息，比如：主目录是什么、使用何种shell。如果没有指定主目录，将默认为根目录；如果没有指定shell，将默认为/bin/bash。

login程序成功后，会向对应的终端在输出最近一次登录的信息(在/var/log/lastlog中有记录)，并检查用户是否有新邮件(在/usr/spool/mail/的对应用户名目录下)。然后开始设置各种环境变量：对于bash来说，系统首先寻找/etc/profile脚本文件，并执行它；然后如果用户的主目录中存在.bash_profile文件，就执行它，在这些文件中又可能调用了其它配置文件，所有的配置文件执行后后，各种环境变量也设好了，这时会出现大家熟悉的命令行提示符，到此整个启动过程就结束了。

希望通过上面对Linux启动过程的剖析能帮助那些想深入学习Linux用户建立一个相关Linux启动过程的清晰概念，进而可以进一步研究Linux接下来是如何工作的。