四、静态链接
-
首先放一个例子,从这里来看静态链接到底做什么。
-
1. 空间与地址的分配
- 首先,对于两个目标文件,肯定要合并到一起,各个段合并在一起。一般链接器都会将不同目标文件的相同段放在一起。
- 空间与地址的分配: 扫描输入目标文件,并且获得它们的各个段的长度、属性和位置,把不同符号表中的符号统一放到全局符号表。这一步中,链接器将能够获得所有输入目标文件的段长度,并且将它文件中各个段合并后的长度与位置,并建立映射关系。
- 在完成这些之后,链接器计算符号的地址(虚拟地址),因为地址分配完成了,各个符号在各个段内的位置固定了。
-
2.符号解析与重定位
- 符号解析与重定位:使用上面第一步中收集到的所有信息,读取输入文件中段的数据、重定位信息,并且进行符号解析与重定位、调整代码中的地址等。事实上第二步是链接过程的核心,特别是重定位过程。
- 来看上面的图片例子,在编译完成后,shared和swap()的地址在汇编代码中,都还是无意义的,需要将正确的替换,链接器会替换为刚才分配的正确地址。
- 链接器如何知道哪些指令和变量需要被调整?从重定位表获取。也叫重定位段。比如.text段中需要重定位的入口会保存在.rel.text中
- 符号解析:当找到重定位入口的符号时,我需要知道这个符号在哪,目标地址是多少。(假如链接时少了哪个库,则会报错“链接时符号未定义”。) 这时会去找全局符号表,找到后进行重定位。
- 对于强符号、弱符号的解析问题,不展开了,有需要可以再搜一下,采用了COMMOM块的方法来解决。
-
静态库链接
- 比如说Linux操作系统的一些输入输出就是系统API。LinuxC语言今天库libc。**静态库可以看做一堆目标文件的集合。**比如libc.a里面会有printf.o、stdio.o等。
-
链接过程可以通过ld链接脚本来控制,具体百度。
五、 可执行文件的装载与进程
- 装载的基本过程就是把程序读取到内存的某一个位置。程序是静态的,而要运行必须要加载到操作系统中。运行起来之后,每个程序都会有一个自己的独立的虚拟地址空间。
- 这里就跟操作系统中的虚拟内存、页机制有关了。程序分页,一些在内存一些在硬盘,通过虚拟内存机制来运行。所以其实装载器就是操作系统的存储管理器。
- ELF加入了一个**"Segment"来让同样读写权限**的段放在一起,然后映射到不同的物理空间以减少内部碎片。
- Linux内核装载ELF的过程:
- 首先,首先在用户层面,bash进程会调用 fork()系统调用创建一个新的进程,然后新的进程调用 execve()系统调用执行指定的ELF文件,原先的bash进程继续返回等待刚才启动的新进程结束,然后继续等待用户输入命令。
- 读取ELF文件头之后,需要调用合适的装载处理过程。
- 装载处理过程首先检查文件有效性;然后处理动态链接;根据ELF可执行问价你的程序头表的描述,对ELF文件进行映射,比如代码、数据、只读数据; 然后初始化ELF进程环境,比如进程启动时EDX寄存器的地址应该是 DT_FINI的地址(参照动态链接);将系统调用的返回地址修改为ELF可执行文件的入口点。
- 然后当系统调用返回时,会到程序入口地址,装载完毕。