linux 应用程序的执行过程详解

1.父进程的行为: 复制,等待

执行应用程序的方式有很多,从shell中执行是一种常见的情况。交互式shell是一个进程(所有的进程都由pid号为1的init进程fork得到,关于这个话题涉及到Linux启动和初始化,以及idle进程等,有空再说),当在用户在shell中敲入./test执行程序时,shell先fork()出一个子进程(这也是很多文章中说的子shell),并且wait()这个子进程结束,所以当test执行结束后,又回到了shell等待用户输入(如果创建的是所谓的后台进程,shell则不会等待子进程结束,而直接继续往下执行)。所以shell进程的主要工作是复制一个新的进程,并等待它的结束。

2.子进程的行为: "执行"应用程序
2.1 execve()
另一方面,在子进程中会调用execve()加载test并开始执行。这是test被执行的关键,下面我们详细分析一下。execve()是操作系统提供的非常重要的一个系统调用,在很多文章中被称为exec()系统调用(注意和shell内部exec命令不一样),其实在Linux中并没有exec()这个系统调用,exec只是用来描述一组函数,它们都以exec开头,分别是:

#include
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
这几个都是都是libc中经过包装的的库函数,最后通过系统调用execve()实现(#define __NR_evecve 11,编号11的系统调用)。exec 函数的作用是在当前进程里执行可执行文件,也就是根据指定的文件名找到可执行文件,用它来取代当前进程的内容,并且这个取代是不可逆的,即被替换掉的内容不再保存,当可执行文件结束,整个进程也随之僵死。因为当前进程的代码段,数据段和堆栈等都已经被新的内容取代,所以exec函数族的函数执行成功后不会返回,失败是返回-1。可执行文件既可以是二进制文件,也可以是可执行的脚本文件,两者在加载时略有差别,这里主要分析二进制文件的运行。

2.2 do_execve()
在用户态下调用execve(),引发系统中断后,在内核态执行的相应函数是do_sys_execve(),而do_sys_execve()会调用 do_execve()函数。do_execve()首先会读入可执行文件,如果可执行文件不存在,会报错。然后对可执行文件的权限进行检查。如果文件不是当前用户是可执行的,则execve()会返回-1,报permission denied的错误。否则继续读入运行可执行文件时所需的信息(见struct linux_binprm)。

2.3 search_binary_handler()
接着系统调用search_binary_handler(),根据可执行文件的类型(如shell,a.out,ELF等),查找到相应的处理函数(系统为每种文件类型创建了一个struct linux_binfmt,并把其串在一个链表上,执行时遍历这个链表,找到相应类型的结构。如果要自己定义一种可执行文件格式,也需要实现这么一个 handler)。然后执行相应的load_binary()函数开始加载可执行文件。

2.4 load_elf_binary()
加载elf类型文件的handler是load_elf_binary(),它先读入ELF文件的头部,根据ELF文件的头部信息读入各种数据 (header information)。再次扫描程序段描述表,找到类型为PT_LOAD的段,将其映射(elf_map())到内存的固定地址上。如果没有动态链接器的描述段,把返回的入口地址设置成应用程序入口。完成这个功能的是start_thread(),start_thread()并不启动一个线程,而只是用来修改了pt_regs中保存的PC等寄存器的值,使其指向加载的应用程序的入口。这样当内核操作结束,返回用户态的时候,接下来执行的就是应用程序了。
ps:elf文件是一种灵活的二进制文件,可以是包含了数据和文件的可执行的程序,可以是可重定位文件,这些数据是和其他重定位文件和共享的object文件一起链接起来使用的。# file libfoo.o libfoo.o: ELF 32-bit LSB relocatable, Intel 80386, version 1, not stripped 。也或者是一种共享库文件,这些数据是在连接时候被连接器ld和运行时动态连接器使用的,例如 ld-linux.so.1

2.5 load_elf_interp()
如果应用程序中使用了动态链接库,就没有那么简单了,内核除了加载指定的可执行文件,还要把控制权交给动态连接器(program interpreter,ld.so in linux)以处理动态链接的程序。内核搜寻段表,找到标记为PT_INTERP的段中所对应的动态连接器的名称,并使用 load_elf_interp()加载其映像,并把返回的入口地址设置成load_elf_interp()的返回值,即动态链接器入口。当 execve退出的时候动态链接器接着运行。动态连接器检查应用程序对共享连接库的依赖性,并在需要时对其进行加载,对程序的外部引用进行重定位。然后动态连接器把控制权交给应用程序,从ELF文件头部中定义的程序进入点开始执行。(比如test.c中使用了userlib.so中函数foo(),在编译的时候这个信息被放进了test这个ELF文件中,相应的语句也变成了call fakefoo()。当加载test的时候,知道foo()是一个外部调用,于是求助于动态链接器,加载userlib.so,解析foo()函数地址,然后让fakefoo()重定向到foo(),这样call foo()就成功了。)

简短的说,整个在shell中键入./test执行应用程序的过程为:当前shell进程fork出一个子进程(子shell),子进程使用execve来脱离和父进程的关系,加载test文件(ELF格式)到内存中。如果test使用了动态链接库,就需要加载动态链接器(或者叫程序解释器),进一步加载 test使用到的动态链接库到内存,并重定位以供test调用。最后从test的入口地址开始执行test。

PS:  现代的动态链接器因为性能等原因都采用了延迟加载和延迟解析技术,延迟加载是动态连接库在需要的时候才被加载到内存空间中(通过页面异常机制),延迟解析是指到动态链接库(以加载)中的函数被调用的时候,才会去把这个函数的起始地址解析出来,供调用者使用。动态链接器的实现相当的复杂,为了性能等原因,对堆栈的直接操作被大量使用,感兴趣的可以找相关的代码看看。

出自:http://blog.sina.com.cn/s/blog_4a1f59bf0100h3ry.html

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Uboot启动Linux过程详解: 1. Uboot加载内核镜像:Uboot首先会从存储设备(如SD卡、NAND Flash等)中加载内核镜像到内存中。 2. 设置内核启动参数:Uboot会设置内核启动参数,包括内核镜像在内存中的位置、根文件系统的位置、启动参数等。 3. 启动内核:Uboot会将控制权交给内核,让内核开始执行。内核会进行一系列初始化操作,包括初始化CPU、内存、设备驱动等。 4. 挂载根文件系统:内核会挂载根文件系统,使得用户可以访问文件系统中的文件和目录。 5. 启动用户空间:内核会启动用户空间,即启动init进程。init进程会读取配置文件,启动各种系统服务和应用程序。 6. 用户空间运行:一旦用户空间启动成功,系统就进入了正常的运行状态,用户可以使用各种应用程序和系统服务。 总之,Uboot启动Linux过程是一个复杂的过程,需要多个组件协同工作,才能让系统正常启动并运行。 ### 回答2: Uboot是嵌入式系统中常用的一个开源启动加载程序,其主要功能是在嵌入式操作系统中启动Linux系统,并初始化系统硬件资源。Uboot在整个Linux系统启动过程中起到很关键的作用,下面就来详细介绍一下Uboot启动Linux过程. 一、Uboot的加载 第一个引导程序(Bootloader)需要存放在系统的闪存中,是Linux系统启动的重要组成部分。当开机后CPU默认开始执行闪存芯片0的地址,此时Uboot就被加载到RAM中,并执行。由于Uboot同样位于一块桥接器和一个NOR Flash的四接口ARM微控制器总线上,因此Uboot在存储器刚刚发挥了重要作用。 在Uboot的启动过程中,系统会根据用户的选择进行环境的设置,比如启动选项、串口设置等。同时,Uboot还会初始化内存,并将内核镜像加载到内存中,准备启动内核。 二、内核的启动 Linux内核启动主要分为五个过程,分别是: 1.内核加载 当Uboot初始化完成后,系统进入内核加载阶段。Uboot会将存放在NOR Flash中的内核镜像加载到系统主内存中。在加载内核时,会有一个fdt文件,该文件是系统在启动时加载设备树的重要文件,在设备树的启动阶段,大部分设备驱动程序都是通过fdt中的节点进行解析。 2.内核装载初始化 在内核镜像成功加载到内存中后,Linux内核开始进入装载初始化,该阶段主要进行一些内部的初始化工作,比如初始化调度程序、内存管理、文件系统等;此外还会启动ELF文件解析程序,解析各个驱动模块,以便后续的设备树解析和驱动程序的加载。 3.设备树解析 在内核镜像加载到内存中之后,Linux会对设备树进行解析。设备树是在启动时由Uboot加载、传递给内核的一种数据结构,主要用于描述系统的硬件资源分布情况,是操作系统启动过程中很关键的一环,因为设备树可以为操作系统提供有关系统硬件的信息,便于操作系统启动后初始化对应的硬件资源。 4.初始化进程 在设备树解析完成之后,Linux会进入初始化进程的阶段。在这个过程中,系统会完成一系列的启动脚本,完成基本系统的初始化,并启动基本服务。 5.用户空间启动 当初始化进程执行完毕后,系统进入用户空间启动阶段。此时可以执行用户的应用程序,系统也正式进入了可用状态了。 三、总结 以上就是Uboot启动Linux过程详解了。在整个启动过程中,Uboot不仅完成了硬件资源初始化,还实现了内核和用户空间的启动,是整个系统的重要组成部分。对于嵌入式设备的开发者来说,深入了解Uboot的启动过程,对于准确定位问题和有序开发代码具有很大的帮助。 ### 回答3: uboot是嵌入式系统中常用的一个启动引导程序,其作用是加载Linux内核文件到系统中,并启动该内核从而让系统正常运行。本文就uboot启动linux过程进行详细的分析。 uboot启动linux过程: 1. CPU从复位向量开始执行: 当CPU启动时,会首先寻找复位向量所在的地址,并执行该地址中存储的指令。在嵌入式系统中,这个复位向量通常被配置为uboot程序的起始地址。 2. 加载uboot程序: uboot启动后会先加载自身的程序代码。uboot的程序包括bootloader和一些工具函数,它们可以执行一些用户定制的任务,比如读写参数、显示系统信息等操作,然后才会加载Linux内核。 3. 加载Linux内核: 在uboot加载内核时,它首先要根据指定的地址和大小,从存储介质中读取内核文件,并将其存储到内存中。在读取内核文件期间,uboot会进行一些配置操作,比如初始化内存、配置内存映射等操作。 4. 启动Linux内核: Linux内核启动时需要设置一些参数,这些参数通常由uboot传递给内核。例如,uboot会告诉内核内存的位置和大小、设备树等信息。接着,内核会根据这些参数进一步初始化系统,比如建立内存映射表、配置硬件设备等操作。这些操作完成后,Linux内核会开始执行用户空间程序,使得系统正常运行。 总结: 通过上述分析可知,uboot启动Linux过程涉及到多个环节,其中包括uboot程序的加载、Linux内核的加载以及启动Linux内核时传递参数等操作。在实际系统中,这些过程需要针对具体的硬件平台进行适当的定制,才能保证系统正常启动和运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值