下面的例子用于帮助理解程序编译和链接。
一个C语言源程序包括两个文件:main.c 和fun.c,如下:
//main.c
#include "stdio.h"
extern int add(int a,int b);
int main()
{
int a,b,result;
printf("Pleaseinput a & b\n");
scanf("%d%d",&a,&b);
result= add(a,b);
printf("resultis %d",result);
}
//fun.c
int add(int a,int b)
{
return a+b;
}
fun.c中定义了函数add,main.c中调用了add函数以及库函数printf和scanf。
用如下指令分别将main.c和fun.c编译成目标文件:
gcc -c main.c //生成目标文件main.o
gcc -c fun.c //生成目标文件fun.o
用命令objdump -t main.o 查看一下main.o 目标文件的符号表:
从中可以看到,main.c中对外部引用的符号都定义为“UND”,这样到链接阶段就去其它的文件中去寻找这些未定义的符号。
用命令objdump -D main.o 查看main.o的反汇编代码:
其中四个call指令对应的是main函数中的四次函数调用,从左边的指令可以看出,这四次函数调用目前的地址部分都为零:e8 00 00 00 00,因为这些函数都在外部文件中,目前没法确定它们的地址。
用命令gcc main.o fun.o 将目标文件链接成可执行文件a.out。
注:链接指令本来是ld,但除了main.o和fun.o,还需要写很多库文件,所以用gcc命令自动去加库文件。
现在用命令objdump -D a.out 查看链接后可执行文件的反汇编代码:
可以看到,add函数对应的代码链接到了main函数的后面,最关键的是main函数中四个call指令的后面都有了具体的地址,比如第三个调用add函数的call指令的后面是400641,正是add函数的起始地址。但是有一点需要注意,左边的指令部分却为:e8 19 00 00 00,从中看不到地址400641的影子。这是因为,函数调用时,指令中用的其实是目的地址相对于当前指令的下一条指令的偏移量。在这个例子中,就是400641相对于400628的偏移量,即0x400641- 0x400628 = 0x19。
从这个例子中可以看到,链接完成后,原来不确定的外部引用都有了确定的地址,也就是书上说的“指令代真”,这正是链接的重要任务之一。