文章目录
章前导读
链接
是将各种代码和数据片段收集并组合成为一个单一文件的过程,这个文件可被加载
到内存并执行。链接可以执行于编译时
,也就是在源代码被翻译成机器代码时;也可以执行于加载时
,也就是程序被加载器
加载到内存并执行时;甚至执行于运行时
,也就是由应用程序来执行。现在系统中,链接是由叫做链接器
的程序自动执行的。
链接器
使得分离编译
成为可能。这样我们可以独立修改和编译不同的模块,改变这些模块中的一个时,只需要简单地重新编译它,并重新链接应用,而不必重新编译其他文件。
编译器驱动程序
大多数编译系统提供编译器驱动程序
,它代表用户在需要时调用语言预处理器、编译器、汇编器和链接器。下图展示了驱动程序将程序从ASCII码源文件翻译成可执行目标文件时的行为。
在运行可执行文件prog时,shell调用操作系统中一个叫做加载器
的函数,他将可执行文件prog中的代码和数据复制到内存,然后将控制转移到这个程序的开头。
静态链接
像Linux LD程序这样的静态链接器
以一组可重定位目标文件和命令行参数作为输入,生成一个完全链接的、可以加载和运行的可执行目标作为输出。输入的可重定位目标文件由各种不同的代码和数据节组成,每一节都是一个连续的字节序列。指令在一节中,初始化了的全局变量在另一节中,而未初始化的变量又在另外一节中。
为了构造可执行文件,链接器完成如下两个主要任务:
1.符号解析
。目标文件定义和引用符号
,每个符号对应于一个函数、一个全局变量或一个静态变量(C语言中任何以static属性声明的变量)
。符号解析的目的是将每一个符号引用
正好和一个符号定义
关联起来。
2.重定位
。编译器和汇编器生成从地址0开始的代码和数据节。链接器通过把每个符号定义与一个内存为止关联,从而重定位
这些节,然后修改所有这些符号的引用,使得它们纸箱这个内存位置。链接器使用汇编器产生的重定位条目
的详细指令,不加甄别地执行这样的重定位。
目标文件纯粹是字节块的集合。这些块中,有些包含程序代码,有些包含程序数据,而其他的则包含引导链接器和加载器的数据结构。链接器将这些块连接起来,确定被连接块的运行时位置,并且修改代码和数据块中的各种位置。
目标文件
目标文件有三种形式:
1.可重定位目标文件
。包含二进制代码和数据,其形式可以在编译时与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2.可执行目标文件
。包含二进制代码和数据,其形式可以被直接复制到内存并执行
3.共享目标文件
。一种特殊类型的可重定位目标文件,可以在加载或运行时被动态地加载进内存并链接。
编译器和汇编器生成可重定位目标文件(包括共享目标文件)。链接器生成可执行目标文件。
可重定位目标文件
下图是一个典型的ELF可重定位目标文件的格式。不同节的位置和大小是由节头部表表述的,其中目标文件中每个节都有一个固定大小的条目。