对于链接器来说,整个链接过程中,它就是将几个输入目标文件加工后合并成一个输出文件。
“链接器为目标文件分配地址和空间”这句话中的”地址和空间”其实有两个含义:第一个是在输出的可执行文件中的空间;第二个是在装载后的虚拟地址中的虚拟地址空间。对于有实际数据的段,比如”.text”和”.data”来说,它们在文件中和虚拟地址中都要分配空间,因为它们在这两者中都存在;而对于”.bss”这样的段来说,分配空间的意义只局限于虚拟地址空间,因为它在文件中并没有内容。
整个链接过程分两步:
第一步:空间与地址分配:扫描所有的输入目标文件,并且获得它们的各个段的长度、属性和位置,并且将输入目标文件中的符号表中所有的符号定义和符号引用收集起来,统一放到一个全局符号表。这一步中,链接器将能够获得所有输入目标文件的段长度,并且将它们合并,计算出输出文件中各个段合并后的长度与位置,并建立映射关系。
第二步:符号解析与重定位:使用上面第一步中收集到的所有信息,读取输入文件中段的数据、重定位信息,并且进行符号解析与重定位、调整代码中的地址等。
ELF文件还定义了两种特殊的段:
(1) .init:该段里面保存的是可执行指令,它构成了进程的初始化代码。因此,当一个程序开始运行时,在main函数被调用之前,Glibc的初始化部分安排执行这个段的中的代码。
(2) .fini:该段保存着进程终止代码指令。因此,当一个程序的main函数正常退出时,Glibc会安排执行这个段中的代码。
1. 空间与地址分配
相似段合并:将所有输入文件的”.text”合并到输出文件的”.text”段,接着是”.data”段、”.bass”段等,如下图所示:”.bss”段在目标文件和可执行文件中并不占用文件的空间,但是它在装载时占用地址空间。所以链接器在合并各个段的同时,也将”.bss”合并,并且分配虚拟空间。
测试代码a.c和b.c内容如下:
// a.c
#include "b.h"
extern int shared;
int main()
{
int a = 100;
swap(&a, &shared);
}
//b.h
void swap(&a, &shared);
// b.c
#include "b.h"
int shared = 1;
void swap(int* a, int* b)
{