编译、链接与库

一. 常见的编译链接过程

将一个程序编译成可执行程序的步骤如下图所示:
这里写图片描述

我们通过如下的以下两段代码,来详细展示的编译,链接过程:

// code/link/main.c
int sum(int *a, int n);

int array[2] = {1, 2}
int main(){
  int val = sum(array, 2);
  return val;
}


//code/link/sum.c
int sum(int *a, int n){
  int i, s = 0;
  for(i = 0; i < n; i++){
    s += a[i];
  }
  return s;
}
  • 预处理器(cpp):将 C 语言代码*.c翻译成一个ASCII 码的中间文件 *.i 文件。主要处理那些源代码文件中以# 开始的预编译指令。

    $ gcc -E main.c -o tmp/main.i
  • 编译器 (ccl):主要是把预处理完的文件*.i进行一系列的词法分析、语法分析、语义分析和优化后生成相应的汇编代码文件*.s

    $ gcc -S tmp/main.i -o tmp/main.s
  • 汇编器(as):将汇编代码*.s经过汇编器的处理转换成机器可以执行的目标文件代码*.o

    $ gcc -c tmp/main.s -o tmp/main.o
  • 链接器(ld):将目标文件*.o以及所需静态库lib.a经过链接器的处理生成可执行文件(*.out)。

    在此我们对 sum.c 执行相同的命令,生成对应的sum.o, 然后将两者链接起来,创建一个可执行目标文件。

    $ gcc -o prog tmp/main.o tmp/sum.o
  • 加载器(loader):将可执行程序加载到内存并运行。

    $ ./prog

二. 链接(Linking)

​ 链接是将各种代码和数据片段收集并组合成为一个单一文件的过程,这个文件可以被加载(复制)到内存并执行。链接可以执行与编译时(compile-time),加载时(load-time),运行时(run-time)。 链接在软件开发中扮演了一个关键的决策,因为它使得分离编译(separate compilation)成为可能。

​ 连接器主要完成两个主要任务:

  • 符号解析(symbol resolution):

    目标文件定义和引用符号,每个符号对应于一个函数,一个全局变量或一个静态变量。符号解析的目的是将每个符号引用正好和一个符号定义关联起来

  • 重定位(relocation)
    编译器和汇编器生成从地址0开始的代码和数据节。连接器把每个符号定义和内存位置关联起来,从来重新定位这些节,然后修改这些符号的引用,使得它们指向这个内存位置。

目标文件纯粹是字节块的几何。这些块中有些包含程序代码,有些包含程序数据,而其他的则包含引导连接器和加载器的数据结构。链接器将这些块链接起来,确定被链接块的运行时的位置,并且修改代码和数据块中的各种位置。连接器对目标及其了解甚少,编译器和汇编器已经完成了大部分工作。

三. 静态库与动态库

库是写好的现有的,成熟的,可以复用的代码。现实中每个程序都要依赖很多基础的底层库,不可能每个人的代码都从零开始,因此库的存在意义非同寻常。本质上来说库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。库有两种:静态库(.a.lib)和动态库(.so.dll)。

静态链接库

​ 静态库在编译期间由编译器与连接器将它集成至应用程序内,并制作成目标文件以及可以独立运作的可执行文件。其实一个静态库可以简单看成是一组目标文件(.o/.obj文件)的集合,即很多目标文件经过压缩打包后形成的一个文件。静态库特点总结:

  • 静态库对函数库的链接是放在编译时期完成的。
  • 程序在运行时与函数库再无瓜葛,移植方便。
  • 浪费空间和资源,因为所有相关的目标文件与牵涉到的函数库被链接合成一个可执行文件。

​ 静态库制作的具体过程就是把不同文件的 .o 文件通过 Archiver 打包成为一个 .a 文件,并且对其进行编号和索引,以便查找和检索。Archiver 支持增量更新,如果有函数变动,只需要重新编译改动的部分。

动态链接库

​ 空间浪费是静态库的一个问题。另一个问题是静态库对程序的更新、部署和发布页会带来麻烦。如果静态库liba.lib更新了,所以使用它的应用程序都需要重新编译、发布给用户。

​ 动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入。不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例,规避了空间浪费问题。动态库在程序运行是才被载入,也解决了静态库对程序的更新、部署和发布页会带来麻烦。用户只需要更新动态库即可,增量更新。动态库特点总结:

  • 动态库把对一些库函数的链接载入推迟到程序运行的时期。
  • 可以实现进程之间的资源共享。(因此动态库也称为共享库)
  • 将一些程序升级变得简单。
  • 甚至可以真正做到链接载入完全由程序员在程序代码中控制(显示调用)。

Linux下gcc编译的执行文件默认是ELF格式,不需要初始化入口,亦不需要函数做特别的声明,编写比较方便。与创建静态库不同的是,不需要打包工具(ar、lib.exe),直接使用编译器即可创建动态库。

静态链接和动态链接过程:
这里写图片描述

参考
C++静态库与动态库 http://www.cnblogs.com/skynet/p/3372855.html
《程序员的自我修养:编译、链接和库》
《深入理解计算机系统》

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值