从一个cpp文件到一个exe文件,大概经历了以下过程:
预处理(preprocessor)
根据预处理命令组装成新的C/C++程序,常以i为扩展名。这个过程包括:宏的替换、删除注释、处理预处理指令(如#include、#ifdef)。
编译(complier)
将得到的i文件翻译成汇编代码,即.s文件。
汇编(assembler)
将汇编文件翻译成机器指令,并打包成可重定位目标程序的o文件。该文件是二进制文件,字节编码是机器指令。编译器把一个cpp编译汇编得到目标文件时,除了要在目标文件里写入cpp里包含的数据和代码,还要至少提供3个表:
- 未解决符号表(unresolved symbol table):提供所有在编译单元里引用但定义不在本编译单元里的符号及其出现的地址;
- 导出符号表(export symbol table):提供本编译单元具有定义,且愿意提供给其它编译单元使用的符号及其地址(全局作用域);
- 地址重定向表(address redirect table):提供本编译单元所有对自身地址的引用的记录。
链接(
linker)
由汇编程序生成的目标文件并不能立即就被执行,其中可能还有许多没有解决的问题。例如,某个源文件中的函数可能引用了另一个源文件中定义的某个符号(如变量或函数调用)或程序中可能调用了某个库文件中的函数。将引用的其它o文件并入到我们程序所在的o文件中并进行处理,方可得到最终的可执行文件。
链接器进行链接的时候,首先决定各个目标文件在最终可执行文件里的位置。然后访问所有目标文件的地址重定向表,对其中记录的地址进行重定向(即加上该编译单元实际在可执行文件里的起始地址)。然后遍历所有目标文件的未解决符号表,并且在所有的导出符号表里查找匹配的符号,并在未解决符号表中所记录的位置上填写实际的地址(也要加上拥有该符号定义的编译单元实际在可执行文件里的起始地址)。最后把所有的目标文件的内容写在各自的位置上,再做一些别的工作,即得到一个可执行文件。
PS:实际链接的时候更为复杂,因为实际的目标文件里把数据或代码分为好几个区,重定向等要按区进行,但原理一样。
内部链接:一个名称对编译单元(cpp文件)来说是局部的,在链接的时候其它的编译单元无法链接到它;
外部链接:一个名称对编译单元来说不是局部的,在链接的时候其它的编译单元可以访问它,即它可以和别的编译单元交互。
References:
http://www.cnblogs.com/magicsoar/p/3760201.html
http://blog.163.com/sentimental_man/blog/static/7300161820111016103418932/