本文将介绍如何将 C/C++ 语言编写的程序转换成为处理器能够执行的二进制代码的过程,包括四个步骤:预处理(Preprocessing)编译(Compilation)汇编(Assembly)链接(Linking)。
在此之前,首先来看一下 GCC 工具链。
一、GCC 工具链
GCC
是 GUN Compiler Collection
的简称,是 Linux 系统上常用的编译工具。GCC 工具链软件包括 GCC
、Binutils
、C 运行库等。
- GCC
GCC
(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++ 语言编写的程序转换成为处理器能够执行的二进制代码的过程即由编译器完成。
- Binutils
- 一组二进制程序处理工具,包括:
addr2line
、ar
、objcopy
、objdump
、as
、ld
、ldd
、readelf
、size
等。这一组工具是开发和调试不可缺少的工具,分别简介如下:addr2line
:用来将程序地址转换成其所对应的程序源文件及所对应的代码行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对应的源代码位置。as
:主要用于汇编,有关汇编的详细介绍请参见后文。ld
:主要用于链接,有关链接的详细介绍请参见后文。ar
:主要用于创建静态库。为了便于初学者理解,在此介绍动态库与静态库的概念:- 如果要将多个
.o
目标文件生成一个库文件,则存在两种类型的库,一种是静态库,另一种是动态库。 - 在 windows 中静态库是以
.lib
为后缀的文件,共享库是以.dll
为后缀的文件。 - 在 Linux 中静态库是以
.a
为后缀的文件,共享库是以.so
为后缀的文件。 - 静态库和动态库的不同点在于代码被载入的时刻不同。静态库的代码在编译过程中已经被载入可执行程序,因此体积较大。共享库的代码是在可执行程序运行时才载入内存的,在编译过程中仅简单的引用,因此代码体积较小。在 Linux 系统中,可以用
ldd
命令查看一个可执行程序依赖的共享库。 - 如果一个系统中存在多个需要同时运行的程序且这些程序之间存在共享库,那么采用动态库的形式将更节省内存。
- 如果要将多个
ldd
:可以用于查看一个可执行程序依赖的共享库。objcopy
:将一种对象文件翻译成另一种格式,譬如将.bin
转换成.elf
、或者将.elf
转换成.bin
等。objdump
:主要的作用是反汇编。有关次命令的详细介绍,可以参考:Linux 下 objdump 命令的使用。readelf
:显示有关 ELF 文件的信息,可以参考前文:ELF 文件格式。size
:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小等,请参见后文了解使用 si
- 一组二进制程序处理工具,包括: