一、编译链接的过程程序从源代码到可执行文件经过四个步骤:预处理、编译、汇编、链接。
1、预处理:
预处理时编译器删除所有的注释“/”和“/**/”;删除所有的“#define”,展开所有的宏定义;处理所有的条件预编译指令;处理“#include”预编译指令,将被包含的文件插入该预编译指令的位置,这一过程是递归进行的;添加行号和文件名标识。
2、编译:
编译时gcc首先要检查代码的规范性、是否有语法错误等,以确定代码实际要做的工作;在检查无误后,gcc把代码翻译成汇编语言。
3、汇编:
汇编后形成的.o格式的文件已经是ELF格式文件了,程序编译后生成的目标文件至少含有3个节区,分别为.text(代码段,通常指用来存放程序执行代码的一块内存区域),.data(数据段通常是指用来存放程序中已初始化的全局变量的一块内存区域)和.bss(BSS段通常是指用来存放程序中未初始化的全局变量的一块内存区域)。
4、链接:
链接是将各种代码和数据部分收集起来并组合成为一个单一文件的过程,这个文件可被加载(或被复制)到内存中并执行。
二、实验过程
1.由于git clone命令一直超时,所以下载下来上传并加载新的内核
2.打开第二个shell窗口进行gdb调试
设置三个断点:sys_execve,load_elf_binary,start_thread。
关闭调试之后,查看elf文件头
实验分析
1、当sys_execve()系统调用从内核态返回到用户态时,EIP寄存器直接跳转到ELF程序的入口地址。
2、execve和fork都是特殊一点的系统调用:一般的都是陷入到内核态再返回到用户态。
fork父进程和一般进程调度一样,子进程返回到一个特定的点ret_from_fork,子进程是从ret_from_fork开始执行然后返回到用户态。
execve特殊:执行到可执行程序–陷入内核–构造新的可执行文件–覆盖掉原可执行程序–返回到新的可执行程序,作为起点(也就是main函数) ,需要构造他的执行环境。
3、对于静态链接的可执行程序和动态链接的可执行程序 execve 系统调用返回时会有什么不同?
静态链接:elf_entry指向可执行文件的头部,一般是main函数,是新程序执行的起点,一般地址为0x8048XXX的位置。
动态链接:elf_entry指向ld即动态链接器的起点load_elf_interp。