【参考连接】
1. 什么是动(静态库)
在程序编写的过程中,会使用到大量的函数,有些函数是自己定义的,有些则是直接从已有的第三方函数库中调用的。函数库文件分为两种类型,一种是静态库(库程序是直接注入目标程序的,不分彼此,库文件通常以.a结尾),另一种是动态库(库程序是在运行目标程序时(中)加载的,库文件通常以.so结尾)。
2. 源代码到可执行文件的过程
以“hello world”程序为例。这个程序得到可执行文件一般这样操作:首先执行g++ helloworld.cpp命令得到a.out文件;然后,执行./a.out命令就可以输出hello world。但是,事实上执行g++ helloworld.cpp可以分为四个步骤,分别是预处理,编译,汇编,和链接。
2.1 预处理
宏的使用: https://www.cnblogs.com/zi-xing/p/4550246.html
预处理可以得到.i文件,使用的命令是g++ -E helloworld.cpp -o helloworld.i
预处理的过程主要处理那些源代码文件中只能够以“#”开始的预处理指令,主要规则如下:
- 将所以#define删除,并将宏定义展开。
- 处理一些条件预编译指令如#ifndef,#ifdef,#elif,#else,#endif等。将不必要的代码过滤掉。
- 处理#include预编译指令,将被包含的文件插入到该预编译指令的位置。这个过程是递归进行的,因为被包含的文件可能也包含其他文件。
- 预处理过程还会过滤掉所有注释/**/和//里面的内容。
- 另外还会添加行号和文件名标识。
- 最后会保留#pragma编译器指令,因为编译器需要使用它们。
2.2 编译
编译可以得到.s文件, 使用的命令是g++ -S helloworld.i -o helloworld.s
。编译就是将预处理的文件进行一系列的词法分析,语法分析,语义分析,以及优化后产生相应的汇编代码文件,这个过程是程序构建的核心部分,也是最复杂的。整个编译过程又分为六部分:词法分析、语法分析、语义分析、源代码优化、代码生成和目标代码优化。
2.3 汇编
汇编可以得到.o或者.obj文件, 使用的命令是gcc -c helloworld.s -o helloworld.o
。汇编过程实际上指把汇编语言代码翻译成目标机器指令的过程,即生成目标文件。对于被翻译系统处理的每一个C语言源程序,都将最终经过这一处理而得到相应的目标文件。目标文件中所存放的也就是与源程序等效的目标的机器语言代码。目标文件由段组成,通常一个目标文件中至少有两个段:
- 代码段:该段中所包含的主要是程序的指令。该段一般是可读和可执行的,但一般却不可写。
- 数据段:主要存放程序中要用到的各种全局变量或静态的数据。一般数据段都是可读,可写,可执行的。
UNIX环境下主要有三种类型的目标文件:
- 可重定位文件:其中包含有适合于其它目标文件链接来创建一个可执行的或者共享的目标文件的代码和数据。
- 共享的目标文件:这种文件存放了适合于在两种上下文里链接的代码和数据。第一种事链接程序可把它与其它可重定位文件及共享的目标文件一起处理来创建另一个目标文件;第二种是动态链接程序将它与另一个可执行文件及其它的共享目标文件结合到一起,创建一个进程映象。
- 可执行文件:它包含了一个可以被操作系统创建一个进程来执行之的文件。
汇编程序生成的实际上是第一种类型的目标文件。对于后两种还需要其他的一些处理方能得到,这个就是链接程序的工作了。
2.4 连接
连接可以得到.out或者.exe文件。链接就是把每个源代码独立的编译,然后按照它们的要求将它们组装起来,链接主要解决的是源代码之间的相互依赖问题,链接的过程包括地址和空间的分配,符号决议,和重定位等这些步骤。最基本的静态链接如图所示:
每个目标文件除了拥有自己的数据和二进制代码外,还拥有三个表,未解决符号表,地址重定向表,导出符号表。根据开发人员指定的库函数的链接方式的不同,链接处理可以分静态连接库和动态连接库两种。
2.4.1 静态连接库
在链接阶段,会将汇编生成的目标文件.o与引用到的库一起链接打包到可执行文件中,因此对应的链接方式称为静态链接。静态库可以简单看成是一组目标文件(.o/.obj文件)的集合,即很多目标文件经过压缩打包后形成的一个文件。
静态库的缺点在于:浪费空间和资源,因为所有相关的目标文件与牵涉到的函数库被链接合成一个可执行文件。
2.4.2 动态连接库
动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入。不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例,规避了空间浪费问题。动态库在程序运行是才被载入,也解决了静态库对程序的更新、部署和发布页会带来麻烦。用户只需要更新动态库即可,增量更新。