C++ 编译、链接、静态链接库、动态链接库原理总结

连风都笑我了

已于 2022-08-16 16:18:17 修改

阅读量2.6k

点赞数 1

分类专栏： C++ 文章标签： c++ 开发语言

于 2022-08-15 17:38:39 首次发布

本文链接：https://blog.csdn.net/z164470/article/details/126349684

版权

C++ 专栏收录该内容

18 篇文章 2 订阅

订阅专栏

C++ 编译链接

简单说下总体流程：读取源程序——预处理——编译——汇编——链接。
在这里插入图片描述

预处理器先处理各种宏定义，然后交给编译器；
编译器编译成.s为后缀的汇编代码；
汇编代码再通过汇编器形成.obj/.o机器码（二进制）；
最后通过链接器将一个个目标文件（库文件/.obj/.o）链接成一个完整的可执行程序（或者静态库、动态库）。

1.1 预处理

预处理阶段：

宏#define。将所有的#define删除并展开所有的宏。
条件编译指令，如#ifdef，#ifndef，#else，#elif，#endif等。
头文件包含，#include。将包含的文件插入到预编译的文件中
过滤所有的注释符号。
添加行号和文件标识。方便再编译器产生调试用的行号信息等。
特殊符号（不必深究什么符号）

1.2 编译

1.2.1 预编译

编译程序所要作得工作就是通过词法分析和语法分析，在确认所有的指令都符合语法规则之后，将其翻译成等价的汇编语言。

1.2.2 优化

优化一部分是对中间代码的优化。这种优化不依赖于具体的计算机。主要的工作是删除公共表达式、循环优化（代码外提、强度削弱、变换循环控制条件、已知量的合并等）、复写传播，以及无用赋值的删除等。
另一种优化则主要针对目标代码的生成而进行的。同机器的硬件结构密切相关，最主要的是考虑是如何充分利用机器的各个硬件寄存器存放的有关变量的值，以减少对于内存的访问次数。另外，如何根据机器硬件执行指令的特点（如流水线、RISC、CISC、VLIW等）而对指令进行一些调整使目标代码比较短，执行的效率比较高。

1.3 汇编

把汇编语言代码翻译成目标机器指令，生成目标文件（.o/.obj文件，都是二进制文件）。此过程会依赖机器的硬件和操作系统环境。
.o文件至少需要提供三张表
- 导出符号表：即该目标文件可以提供的符号及地址
- 未解决符号表：即找不到地址的符号的列表，告诉链接器这些符号没找到地址。
- 地址重定向表：链接的时候，链接器会为目标文件的“未解决符号表”里的符号在其他目标文件中寻找地址，但是每个目标文件的地址都是从0x0000开始的，这样直接将对方文件中符号的地址拿过来用显然会是不正确的，为了区分不同的文件，链接器在链接时就会对每个目标文件的地址进行调整。在这个例子中，假如B.obj的0x0000被定位到可执行文件的0x00001000上，而A.obj的0x0000被定位到可执行文件的0x00002000上，那么实现上对链接器来说，A.obj的导出符号地地址都会加上0x00002000，B.obj所有的符号地址也会加上0x00001000。这样就可以保证地址不会重复。因为被加上了起始地址，所以符号在自身文件中的实际地址就不对了，需要再用一张地址重定向表记录符号相对自身文件的地址。

操作系统	文件后缀
windows	.obj
Linux	.o

1.4 链接

链接的主要工作就是将有关的目标文件彼此相连接。因为汇编程序生成的目标文件并不能立即就被执行，其中可能还有许多没有解决的问题。例如，某个源文件中的函数可能引用了另一个源文件中定义的某个符号（如变量或者函数调用等）；在程序中可能调用了某个库文件中的函数等等。所有的这些问题，都需要经链接程序的处理方能得以解决。
根据链接方式的不同，可以分为静态链接与动态链接。

1.4.1 静态链接库和动态链接库

静态链接库：静态链接使用静态链接库，链接器从静态链接库lib获取所有被引用函数，并将库同代码一起放到可执行文件中。这样该程序在被执行时这些代码将被装入到该进程的虚拟地址空间中。可以看作是一些目标代码的集合，在可执行程序运行前(链接阶段）就已经加入到执行代码中，成为执行程序的一部分。
动态链接库：运行时加载。包含了函数所在的dll文件和文件中函数位置的信息（入口），代码由运行时加载在进程空间中的dll提供。链接阶段没有被复制到程序中，只是在最终的可执行程序中记录下共享对象的名字以及其它少量的登记信息，在程序运行的时候由系统动态加载到内存中供程序调用。程序运行时把dll里面的代码和资源加载到进程的虚地址空间，所以叫动态链接。

库	windows后缀	Linux后缀
静态链接库	.lib	.a
动态链接库	.dll	.so

1.4.2 .lib/.dll/.exe区别

lib是在编译时需要，dll是在运行时需要。
dll虽然包含了可执行代码却不能单独执行，应由windows应用程序直接或者间接调用。
exe是最终的可执行程序。
开发成功后的应用程序在发布时，只需要有.exe文件和.dll文件，并不需要.lib文件和.h头文件。.h文件是给编译器看的。
静态库和动态库的最大区别是:静态库链接的时候把库直接加载到程序中,加载完成为程序的一部分，程序运行时将不再需要该静态库；而动态库链接的时候，它只是保留接口，将动态库与程序代码独立，这样就可以提高代码的可复用度和降低程序的耦合度。
动态链接库是一个可以被其他应用程序共享的程序模块，其中封装了一些可以被贡献的例程和资源。使用动态链接能够使最终的可执行文件比较短小，并且当共享对象被多个进程使用时能节约一些内存，因为在内存中只需要保存一份此共享对象的代码。但并不是使用动态链接就一定比使用静态链接要优越。在某些情况下动态链接可能带来一些性能上损

1.4.3 静态库和动态库优缺点

静态库的优缺点

优点

静态库被打包到应用程序中加载速度快。
发布程序无需提供静态库，移植方便。

缺点

相同的库文件数据可能在内存中被加载多份，消耗系统资源，浪费内存。
库文件更新需要重新编译，生成新的可执行程序，浪费时间。

动态库优缺点

优点

可实现不同进程间的资源共享。
可执行文件小。
升级简单，只需替换对应动态库即可，无需重新编译整个程序。
可以控制何时加载动态库，不调用库函数动态库不会被加载。
内存中只有一份动态库的实例，避免拷贝，有较小的程序体积。

在这里插入图片描述

缺点

加载速度比静态库慢。
发布程序需提供依赖的动态库。

1.4.4 运行时动态链接和隐式链接

动态链接分两种，隐式链接和显示链接；隐式链接又叫加载时动态链接，显示链接又叫运行时动态链接。

隐式链接

应用程序的代码调用导出 DLL 函数时发生隐式链接。当调用可执行文件的源代码被编译或被汇编时，DLL 函数调用在对象代码中生成一个外部函数引用。若要解析此外部引用，应用程序必须与 DLL 的创建者所提供的导入库（.LIB 文件）链接。
导入库仅包含加载 DLL 的代码和实现 DLL 函数调用的代码。在导入库中找到外部函数后，会通知链接器此函数的代码在DLL 中。要解析对 DLL 的外部引用，链接器只需向可执行文件中添加信息，通知系统在进程启动时应在何处查找 DLL 代码。
系统启动包含动态链接引用的程序时，它使用程序的可执行文件中的信息定位所需的 DLL。如果系统无法定位 DLL，它将终止进程并显示一个对话框来报告错误。否则，系统将 DLL 模块映射到进程的地址空间中。
如果任何 DLL 具有（用于初始化代码和终止代码的）入口点函数，操作系统将调用此函数。在传递到入口点函数的参数中，有一个指定用以指示 DLL 正在附带到进程的代码。如果入口点函数没有返回 TRUE，系统将终止进程并报告错误。最后，系统修改进程的可执行代码以提供 DLL 函数的起始地址。
与程序代码的其余部分一样，DLL 代码在进程启动时映射到进程的地址空间中，且仅当需要时才加载到内存中。因此，由 .def 文件用来在 Windows 的早期版本中控制加载的 PRELOAD 和 LOADONCALL 代码属性不再具有任何意义。

显示链接

大部分应用程序使用隐式链接，因为这是最易于使用的链接方法。但是有时也需要显式链接。下面是一些使用显式链接的常见原因：

直到运行时，应用程序才知道需要加载的 DLL 的名称。例如，应用程序可能需要从配置文件获取 DLL 的名称和导出函数名。
如果在进程启动时未找到 DLL，操作系统将终止使用隐式链接的进程。同样是在此情况下，使用显式链接的进程则不会被终止，并可以尝试从错误中恢复。例如，进程可通知用户所发生的错误，并让用户指定 DLL 的其他路径。如果使用隐式链接的进程所链接到的 DLL 中有任何 DLL 具有失败的 DllMain 函数，该进程也会被终止。同样是在此情况下，使用显式链接的进程则不会被终止。
因为Windows 在应用程序加载时加载所有的 DLL，故隐式链接到许多 DLL 的应用程序启动起来会比较慢。为提高启动性能，应用程序可隐式链接到那些加载后立即需要的 DLL，并等到在需要时显式链接到其他 DLL。
显式链接下不需将应用程序与导入库链接。如果 DLL 中的更改导致导出序号更改，使用显式链接的应用程序不需重新链接（假设它们是用函数名而不是序号值调用 GetProcAddress），而使用隐式链接的应用程序必须重新链接到新的导入库。

显示链接存在的问题

如果 DLL 具有 DllMain 入口点函数，则操作系统在调用 LoadLibrary 的线程上下文中调用此函数。如果由于以前调用了LoadLibrary 但没有相应地调用 FreeLibrary 函数而导致 DLL 已经附加到进程，则不会调用此入口点函数。如果 DLL 使用 DllMain 函数为进程的每个线程执行初始化，显式链接会造成问题，因为调用 LoadLibrary（或AfxLoadLibrary）时存在的线程将不会初始化。服务器负载高，性能下降，导致无法及时的处理客户端的请求，可能是服务器硬件本身需要升级，另外一方面是程序自身的bug导致的吞吐量不够，性能低、还有就是可能是架构问题，比如没有分布式处理，无法动态扩容，基本上你需要查看内存，CPU，磁盘使用情况，使用top，free ，df等命令来动态查看找到异常指标的进程。
如果DLL 将静态作用域数据声明为 __declspec(thread)，则在显式链接时 DLL会导致保护错误。用 LoadLibrary 加载 DLL 后，每当代码引用此数据时 DLL 就会导致保护错误。（静态作用域数据既包括全局静态项，也包括局部静态项。）因此，创建DLL 时应避免使用线程本地存储区，或者应（在用户尝试动态加载时）告诉 DLL 用户潜在的缺陷。

注：

__declspec(thread)作用：如果我们需要一个变量在每个线程中都能访问，并且值在每个线程中互不影响，这就是TLS，变量声明为__declspec(thread)即可。
对于动态链接库，DllMain是一个可选的入口函数。很多仅仅包含资源信息的DLL是没有DllMain函数的。
TLS，线程本地存储。Windows为解决一个进程中多个线程同时访问全局变量而提供的机制。