1. 两份源代码
a.c
#include "stdio.h"
extern int shared;
int main()
{
int a=100;
swap(&a, &shared);
}
b.c
int shared = 1;
void swap(int *a, int *b)
{
*a ^=*b^=*a^=*b;
}
gcc -c a.c b.c 生成a.o b.o
使用objdump -r a.o 看到a.c中两个引外部用的变量和接口都是需要重定位(链接时计算赋予运行时的虚拟地址)的:
2. 链接(环境是macos 链接需要额外增加几个参数)
对比链接前后的段,可以发现链接前代码段都没有分配虚拟地址,链接后代码段合并并且分配了虚拟地址:
两个代码段大小分别是0x2c 0x2e,但是最后合并0x5c确比原来大了两个字节,原因是代码段四字节对齐,a.o红框代码段最后剩余的两个字节不足 合并后使用0x9090补齐了。而且能够明显看到红框代码段合并前后并不完全一样,这就是引用的外部符号链接后重定位的结果
3.重定位过程细节
链接最重要的过程就是确定函数地址,重定位。反汇编可以看出来:
a.o用到了b.o中的两个外部符号shared和swap。链接时指定了入口是main,因此先给main赋了地址0x1F70,再将b.o的代码段地址按照4字节对齐方式放在a.o后面,于是得到了b.o代码段地址0x1f70+0x2e+0x2=0x1fa0,由于b.o只有一个函数swap,因此0x1fa0也是swap的口地址;再将swap的地址填充到链接后的main代码段中去,链接就完成了。
那么,连接器怎么知道要重定位谁?在哪里重定位的呢?实际上,需要重定位的elf文件都有重定位段,它把代码段中需要重定位的符号,符号偏移地址都列出来了:如下图,a.o中游两个外部引用符号,他们的代码段偏移地址分别是0x1d 0xf, 在反汇编代码中一对应,恍然大悟,就是我们上面分析的链接后重定位,填充真实地址那部分代码。
4.编译过程细节
最后gcc加上--verbose参数,编译器会打印出详细的 预编译 编译 链接细节,当我们不知道编译出了什么问题,可以使用这种方式排查 参考:
2022-5-15