GCC 编译器背后的故事及Linux GCC常用命令

目录

一:GCC 编译器背后的故事  

(一)准备工作 

(二) 编译过程 

1.预处理 

2.编译 

3.汇编 

4.链接 

(三)分析 ELF 文件 

1.ELF 文件的段 

​2.反汇编 ELF 

二:Linux GCC 常用命令 ​​​​​​​

1 简介 

2 简单编译 

2.1 预处理 

2.2 编译为汇编代码(Compilation) 

2.3 汇编(Assembly) 

 2.4 连接(Linking) 

3 多个程序文件的编译

4 检错 

​5 库文件连接 

5.1 编译成可执行文件 

​5.2 链接 

5.3 强制链接时使用静态链接库 


​​​​​​​

​​​​​​​


一:GCC 编译器背后的故事  

GCC 不是一个人在战斗,GCC 背后其实有一堆战友。 

​​​​​​​

 GCC: 

GCC(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++语言编写的程序 

转换成为处理器能够执行的二进制代码的过程即由编译器完成。 

 Binutils: 

一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、 

ldd、readelf、 size 等。这 一组工具 是开发和 调试不可 缺少的工具 ,分别简 介 

如下: 

(1) addr2line:用 来将程序 地址转 换成其所 对应的程 序源文 件及所对 应的代 码 

行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对 

应的源代码位置。 

(2) as:主要用于汇编,有关汇编的详细介绍请参见后文。 

(3) ld:主要用于链接,有关链接的详细介绍请参见后文。 

(4) ar:主要用于创建静态库。为了便于初学者理解,在此介绍动态库与静态库 

的概念: 

 如果 要将 多个 .o 目标 文件 生成 一个 库文 件, 则存 在两 种类 型的 库, 一种 是 

静态库,另一种是动态库。 

 在 windows 中 静态 库是 以 .lib 为 后缀 的文 件 ,共 享库 是以 .dll 为 后缀 

的 文 件 。 在 linux 中 静 态 库 是 以 .a 为 后 缀 的 文 件 , 共 享 库 是 以 .so 为 后 缀 

的文件。 

 静 态 库 和 动 态 库 的 不 同 点 在 于 代 码 被 载 入 的 时 刻 不 同 。 静 态 库 的 代 码 在 编 

译 过 程 中 已 经 被 载 入 可 执 行 程 序 , 因 此 体 积 较 大 。 共 享 库 的 代 码 是 在 可 执 

行 程 序 运 行 时 才 载 入 内 存 的 , 在 编 译 过 程 中 仅 简 单 的 引 用 , 因 此 代 码 体 积 

较 小 。 在 Linux 系 统 中 , 可 以 用 ldd 命 令 查 看 一 个 可 执 行 程 序 依 赖 的 共 享 

库。 

 如 果 一 个 系 统 中 存 在 多 个 需 要 同 时 运 行 的 程 序 且 这 些 程 序 之 间 存 在 共 享 

库,那么采用动态库的形式将更节省内存。(5) ldd:可以用于查看一个可执行程序依赖的共享库。 

(6) objcopy:将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或 

者将.elf 转换成.bin 等。 

(7) objdump:主要的作用是反汇编。有关反汇编的详细介绍,请参见后文。 

(8) readelf:显示有关 ELF 文件的信息,请参见后文了解更多信息。 

(9) size:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小 

等,请参见后文了解使用 size 的具体使用实例。 

 C 运行库 

C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库。 

C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类 

型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义 

在 stdio 头文件中。 

C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译 

器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又 

常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支 

持库,称为 C++运行时库。 

(一)准备工作 

由于 GCC 工具链主要是在 Linux 环境中进行使用,因此本文也将以 Linux 系统作 

为工作环 境。为了能够 演示编译的整个 过程,先创建一 个工作目录 test0,然后 

用文本编辑器生成一个 C 语言编写的简单 Hello.c 程序为示例,其源代码如下所 

示:

#include <stdio.h> 

//此程序很简单,仅仅打印一个 Hello World 的字符串。 

int main(void) 

printf("Hello World! \n"); 

return 0; 

}

(二) 编译过程 

1.预处理 

预处理的过程主要包括以下过程:(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编 

译指令,比如#if #ifdef #elif #else #endif 等。 

(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。 

(3) 删除所有注释“//”和“/* */”。 

(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。 

(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。 

使用 gcc 进行预处理的命令如下: 

$ gcc -E hello.c -o hello.i 

// 将源文件 hello.c 文件预处理生成 hello.i 

// GCC 的选项-E 使 GCC 在进行完预处理后即停止 

hello.i 文件可以作为普通文本文件打开进行查看,其代码片段如下所示: 

// hello.i 代码片段 

extern void funlockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__)); 

# 942 "/usr/include/stdio.h" 3 4 

# 2 "hello.c" 2 

# 3 "hello.c" 

int main(void) 

printf("Hello World!" "\n"); 

return 0; 

}

 

2.编译 

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及 

优化后生成相应的汇编代码。 

使用 gcc 进行编译的命令如下: 

$ gcc -S hello.i -o hello.s 

// 将预处理生成的 hello.i 文件编译生成汇编程序 hello.s 

// GCC 的选项-S 使 GCC 在执行完编译后停止,生成汇编程序 

上述命令生成的汇编程序 hello.s 的代码片段如下所示,其全部为汇编代码。// hello.s 代码片段 

main: 

.LFB0:

.cfi_startproc 

pushq %rbp 

.cfi_def_cfa_offset 16 

.cfi_offset 6, -16 

movq %rsp, %rbp 

.cfi_def_cfa_register 6 

movl $.LC0, %edi 

call puts 

movl $0, %eax 

popq %rbp 

.cfi_def_cfa 7, 8 

ret 

.cfi_endproc 

3.汇编 

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 

的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相 

对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理 

器指令的对照表一一翻译即可。 

当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标 

文件后,才能进入下一步的链接工作。注意:目标文件已经是最终程序的某一部 

分了,但是在链接之前还不能执行。 

使用 gcc 进行汇编的命令如下: 

$ gcc -c hello.s -o hello.o 

// 将编译生成的 hello.s 文件汇编生成目标文件 hello.o 

 // GCC 的选项-c 使 GCC 在执行完汇编后停止,生成目标文件 

 //或者直接调用 as 进行汇编 

$ as -c hello.s -o hello.o //使用 Binutils 中的 as 将 hello.s 文件汇编生5成目标文件 

 注意:hello.o 目标文件为 ELF(Executable and Linkable Format)格式的可 

重定向文件。 

4.链接 

链接也分为静态链接和动态链接,其要点如下:(1) 静态链接是指在编译阶段直接把静态库加入

到可执行文件中去,这样可执行 文件会比较大。链接器将函数的代码从其所在地(不同的目标文

件或静态链接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完 成的主要

任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义

和内存地址对应起来然后修改所有对符号的引用)。 

(2) 动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统 

中把相应动态库加载到内存中去。 

 在 Linux 系 统中,gcc 编 译链 接时 的动 态库 搜索 路径 的 顺序 通常 为:首 先从 gcc 命 令的 

参 数-L 指 定的 路径 寻找 ;再 从环 境变 量 LIBRARY_PATH 指 定的 路径 寻址;再 从默 认路 径 

/lib、/usr/lib、 /usr/local/lib 寻找 。 

 在 Linux 系 统中,执 行二 进制 文件 时的 动态 库搜 索路 径的 顺序 通常 为:首 先搜 索编 译目 

标 代码 时指 定的 动态 库搜 索路 径;再 从环 境变 量 LD_LIBRARY_PATH 指 定的 路径 寻址;再 

从 配置 文件/etc/ld.so.conf 中 指定 的动 态库 搜索 路径 ;再 从默 认路 径/lib、/usr/lib 

寻找 。 

 在 Linux 系统 中, 可以 用 ldd 命令 查看 一个 可执 行程 序依 赖的 共享 库。 

由于链接动态库和静态库的路径可能有重合,所以如果在路径中有同名的静态库文件和动 

态库文件,比如 libtest.a 和 libtest.so,gcc 链接时默认优先选择动态库,会链接 

libtest.so,如果要让 gcc 选择链接 libtest.a 则可以指定 gcc 选项-static,该选项会强 

制使用静态库进行链接。以 Hello World 为例: 

如果使用命令“gcc hello.c -o hello”则会使用动态库进行链接,生成的 

ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的动态库 

(使用 Binutils 的 ldd 命令查看)如下所示: 

$ gcc hello.c -o hello 

$ size hello //使用 size 查看大小 

text data bss dec hex filename 

1183 552 8 1743 6cf hello 

$ ldd hello //可以看出该可执行文件链接了很多其他动态库,主要是 Linux 的 glibc 

动态库 

linux-vdso.so.1 => (0x00007fffefd7c000) 

libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fadcdd82000) 

/lib64/ld-linux-x86-64.so.2 (0x00007fadce14c000) 

 如 果 使 用 命 令 “ gcc -static hello.c -o hello”则 会 使 用 静 态 库 进 行 链 接 , 

生成的 ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的 

动态库(使用 Binutils 的 ldd 命令查看)如下所示:$ gcc -static hello.c -o hello 

 $ size hello //使用 size 查看大小 

text data bss dec hex filename 

823726 7284 6360 837370 cc6fa hello //可以看出 text 的代码尺寸 

变得极大 

 $ ldd hello 

not a dynamic executable //说明没有链接动态库 

链接器链接后生成的最终文件为 ELF 格式可执行文件,一个 ELF 可执行文件通常 

被链接为不同的段,常见的段譬如.text、.data、.rodata、.bss 等段。 

(三)分析 ELF 文件 

1.ELF 文件的段 

ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都 

是段(Section)。一个典型的 ELF 文件包含下面几个段: 

.text:已编译程序的指令代码段。 

.rodata:ro 代表 read only,即只读数据(譬如常数 const)。 

.data:已初始化的 C 程序全局变量和静态局部变量。 

.bss:未初始化的 C 程序全局变量和静态局部变量。 

.debug:调试符号表,调试器用此段的信息帮助调试。 

可以使用 readelf -S 查看其各个 section 的信息如下:$ readelf -S hello 

There are 31 section headers, starting at offset 0x19d8: 

Section Headers: 

[Nr] Name Type Address Offset 

Size EntSize Flags Link Info Align 

[ 0] NULL 0000000000000000 00000000 

0000000000000000 0000000000000000 0 0 0 

……

[11] .init PROGBITS 00000000004003c8 000003c8 

000000000000001a 0000000000000000 AX 0 0 4 

……

[14] .text PROGBITS 0000000000400430 00000430 

0000000000000182 0000000000000000 AX 0 0 16 

[15] .fini PROGBITS 00000000004005b4 000005b4 

…… 

2.反汇编 ELF 

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包 

含的指令和数据,需要使用反汇编的方法。 

使用 objdump -D 对其进行反汇编如下: 

$ objdump -D hello 

……

0000000000400526 <main>: // main 标签的 PC 地址 

//PC 地址:指令编码 指令的汇编格式 

400526: 55 push %rbp 

400527: 48 89 e5 mov %rsp,%rbp 

40052a: bf c4 05 40 00 mov $0x4005c4,%edi 

40052f: e8 cc fe ff ff callq 400400 <puts@plt> 

400534: b8 00 00 00 00 mov $0x0,%eax 

400539: 5d pop %rbp 

40053a: c3 retq 

40053b: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1) 

……

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来: 

$ gcc -o hello -g hello.c //要加上-g 选项 

$ objdump -S hello 

……

0000000000400526 <main>: 

#include <stdio.h>int main(void) 

400526: 55 push %rbp 

400527: 48 89 e5 mov %rsp,%rbp 

printf("Hello World!" "\n"); 

40052a: bf c4 05 40 00 mov $0x4005c4,%edi 

40052f: e8 cc fe ff ff callq 400400 <puts@plt> 

return 0; 

400534: b8 00 00 00 00 mov $0x0,%eax 

400539: 5d pop %rbp 

40053a: c3 retq 

40053b: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1) 

……

二:Linux GCC 常用命令 ​​​​​​​

1 简介 

GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 

语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL 

语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语 

言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另 

一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。 

2 简单编译 

示例程序如下: 

//test.c 

#include <stdio.h> 

int main(void) 

printf("Hello World!\n"); 

return 0; 

}

 

 这个程序,一步到位的编译指令是: 

gcc test.c -o test 

实质上,上述编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 

(Compilation)、汇编 (Assembly)和连接(Linking)。 

2.1 预处理 

gcc -E test.c -o test.i 或 gcc -E test.c可以输出 test.i 文件中存放着 test.c 经预处理之后的代码。

打开 test.i 文件,看一看,就明白了。后 面那条指令,是直接在命令行窗口中输出预处理后的代

码. 

 

gcc 的-E 选项,可以让编译器在预处理后停止,并输出预处理结果。在本例中,预处理结果就是将 

stdio.h 文件中的内容插入到 test.c 中了。 

2.2 编译为汇编代码(Compilation) 

预处理之后,可直接对生成的 test.i 文件编译,生成汇编代码: 

gcc -S test.i -o test.s 

 

gcc 的-S 选项,表示在程序编译期间,在生成汇编代码后,停止,-o 输出汇编代码文件。 

2.3 汇编(Assembly) 

对于上一小节中生成的汇编代码文件 test.s,gas 汇编器负责将其编译为目标文件,如下: 

gcc -c test.s -o test.o 

 2.4 连接(Linking) 

gcc 连接器是 gas 提供的,负责将程序的目标文件与所需的所有附加的目标文件连接起来,最终生 

成可执行文件。附加的目标文件包括静态连接库和动态连接库。 

对于上一小节中生成的 test.o,将其与C标准输入输出库进行连接,最终生成程序 test 

gcc test.o -o test 

在命令行窗口中,执行./test, 让它说 HelloWorld 吧! 

3 多个程序文件的编译

通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用 GCC 能够很好地

管理这些编译单元。假设有一个由 test1.c 和 test2.c 两个源文件组成的程序,为了对它们进行编

译,并最终生成可执行程序 test,可以使用下面这条命令: 

gcc test1.c test2.c -o test 

如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起 

来,上面这条命令大致相当于依次执行如下三条命令: 

gcc -c test1.c -o test1.o 

gcc -c test2.c -o test2.o 

gcc test1.o test2.o -o test 

4 检错 

gcc -pedantic illcode.c -o illcode 

-pedantic 编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助 

Linux 程序员离这个目标越来越近。或者换句话说,-pedantic 选项能够帮助程序员发现一些不符合 

ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的 

那些情况,才有可能被 GCC 发现并提出警告。 

除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W 

开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。 

gcc -Wall illcode.c -o illcode 

GCC 给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优 

秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将 

警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror 选项,那 

么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下: 

gcc -Werror test.c -o test 

5 库文件连接 

开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支 

持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、或 lib、dll)的集合。。虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下,而库文 

件则放到/usr/lib/目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib, 

以及系统文件夹下。但也有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己 

的办法来查找所需要的头文件和库文件。 

例如我们的程序 test.c 是在 linux 上使用 c 连接 mysql,这个时候我们需要去 mysql 官网下载 MySQL 

Connectors 的 C 库,下载下来解压之后,有一个 include 文件夹,里面包含 mysql connectors 的头 

文件,还有一个 lib 文件夹,里面包含二进制 so 文件 libmysqlclient.so 

其中 inclulde 文件夹的路径是/usr/dev/mysql/include,lib 文件夹是/usr/dev/mysql/lib 

5.1 编译成可执行文件 

首先我们要进行编译 test.c 为目标文件,这个时候需要执行 

gcc –c –I /usr/dev/mysql/include test.c –o test.o 

5.2 链接 

最后我们把所有目标文件链接成可执行文件: 

gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test 

Linux 下的库文件分为两大类分别是动态链接库(通常以.so 结尾)和静态链接库(通常以.a 结尾), 

二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。 

5.3 强制链接时使用静态链接库 

默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链 

接库,如果需要的话可以在编译时加上-static 选项,强制使用静态链接库。 

在/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.so 和 libmysqlclient.a,为了让 

GCC 在链接时只用到静态链接库,可以使用下面的命令: 

gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test 

静态库链接时搜索路径顺序:1. ld 会去找 GCC 命令中的参数-L 

2. 再找 gcc 的环境变量 LIBRARY_PATH 

3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初 compile gcc 时写在程序内的 

动态链接时、执行时搜索路径顺序: 

1. 编译目标代码时指定的动态库搜索路径 

2. 环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径 

3. 配置文件/etc/ld.so.conf 中指定的动态库搜索路径 

4. 默认的动态库搜索路径/lib 

5. 默认的动态库搜索路径/usr/lib 

有关环境变量: 

LIBRARY_PATH 环境变量:指定程序静态链接库文件搜索路径 

LD_LIBRARY_PATH 环境变量:指定程序动态链接库文件搜索路径

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值