GCC 编译器背后的故事及Linux GCC常用命令

一:GCC 编译器背后的故事

GCC 不是一个人在战斗,GCC 背后其实有一堆战友。
GCC:
GCC(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++语言编写的程序转换成为处理器能够执行的二进制代码的过程即由编译器完成。
Binutils:
一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、 ldd、readelf、 size 等。这 一组工具是开发和 调试不可缺少的工具 ,分别简介:
(1) addr2line:用 来将程序 地址转 换成其所 对应的程 序源文 件及所对 应的代 码
行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对
应的源代码位置。

(2) as:主要用于汇编,有关汇编的详细介绍请参见后文。

(3) ld:主要用于链接,有关链接的详细介绍请参见后文。

(4) ar:主要用于创建静态库。为了便于初学者理解,在此介绍动态库与静态库 的概念:
如果 要将 多个 .o 目标 文件 生成 一个 库文 件, 则存 在两 种类 型的 库, 一种 是 静态库,另一种是动态库。

在 windows 中 静态 库是 以 .lib 为 后缀 的文 件 ,共 享库 是以 .dll 为 后缀 的 文 件 。 在 linux 中 静 态 库 是 以 .a 为 后 缀 的 文 件 , 共 享 库 是 以 .so 为 后 缀 的文件。

静 态 库 和 动 态 库 的 不 同 点 在 于 代 码 被 载 入 的 时 刻 不 同 。 静 态 库 的 代 码 在 编 译 过 程 中 已 经 被 载 入 可 执 行 程 序 , 因 此 体 积 较 大 。 共 享 库 的 代 码 是 在 可 执 行 程 序 运 行 时 才 载 入 内 存 的 , 在 编 译 过 程 中 仅 简 单 的 引 用 , 因 此 代 码 体 积 较 小 。 在 Linux 系 统 中 , 可 以 用 ldd 命 令 查 看 一 个 可 执 行 程 序 依 赖 的 共 享 库。

如 果 一 个 系 统 中 存 在 多 个 需 要 同 时 运 行 的 程 序 且 这 些 程 序 之 间 存 在 共 享 库,那么采用动态库的形式将更节省内存。
(5) ldd:可以用于查看一个可执行程序依赖的共享库。

(6) objcopy:将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或 者将.elf 转换成.bin 等。

(7) objdump:主要的作用是反汇编。有关反汇编的详细介绍,请参见后文。

(8) readelf:显示有关 ELF 文件的信息,请参见后文了解更多信息。

(9) size:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小 等,请参见后文了解使用 size 的具体使用实例。
C 运行库 :
C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库。

C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类 型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义 在 stdio 头文件中。

C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译 器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又 常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支 持库,称为 C++运行时库。

(一)准备工作

先创建一 个工作目录 test3,然后 用文本编辑器生成一个 C 语言编写的简单 Hello.c 程序为示例:
在这里插入图片描述
在这里插入图片描述

(二) 编译过程

1.预处理

预处理的过程主要包括以下过程:
(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编 译指令,比如#if #ifdef #elif #else #endif 等。

(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。

(3) 删除所有注释“//”和“/* */”。

(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。

(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。
使用 gcc 进行预处理:将源文件 hello.c 文件预处理生成 hello.i 。
在这里插入图片描述
在这里插入图片描述

2.编译

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。
使用 gcc 进行编译:将预处理生成的 hello.i 文件编译生成汇编程序 hello.s 。
在这里插入图片描述
在这里插入图片描述

3.汇编

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相 对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理 器指令的对照表一一翻译即可。
使用 gcc 进行汇编:将编译生成的 hello.s 文件汇编生成目标文件 hello.o 。
在这里插入图片描述

4.链接

链接也分为静态链接和动态链接,其要点如下:
(1) 静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行 文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完 成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。

(2) 动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统 中把相应动态库加载到内存中去。

使用命令“gcc hello.c -o hello”则会使用动态库进行链接。生成的 ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的动态库如图所示:
在这里插入图片描述
在这里插入图片描述
使用ldd hello可以看出该可执行文件链接了很多其他动态库,主要是 Linux 的 glibc:
在这里插入图片描述
如 果 使 用 命 令 “ gcc -static hello.c -o hello”则 会 使 用 静 态 库 进 行 链 接 , 生成的 ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的 动态库(使用 Binutils 的 ldd 命令查看)如下所示:
在这里插入图片描述
在这里插入图片描述
使用ldd hello出现not a dynamic executable //说明没有链接动态库 :
在这里插入图片描述

(三)分析 ELF 文件

1.ELF 文件的段

ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都 是段(Section)。一个典型的 ELF 文件包含下面几个段:

.text:已编译程序的指令代码段。

.rodata:ro 代表 read only,即只读数据(譬如常数 const)。

.data:已初始化的 C 程序全局变量和静态局部变量。

.bss:未初始化的 C 程序全局变量和静态局部变量。

.debug:调试符号表,调试器用此段的信息帮助调试。

可以使用readelf -S 查看其各个 section 的信息:
在这里插入图片描述

2.反汇编 ELF

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编:
在这里插入图片描述
使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:
在这里插入图片描述
在这里插入图片描述

二:Linux GCC 常用命令 ​​​​​​​

1 简介

GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL 语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语 言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另 一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。

2 简单编译

在这里插入图片描述
在这里插入图片描述
这个程序,一步到位的编译指令是: gcc test.c -o test
在这里插入图片描述

2.1 预处理

在这里插入图片描述

2.2 编译为汇编代码(Compilation)

在这里插入图片描述

2.3 汇编(Assembly)

在这里插入图片描述

2.4 连接(Linking)

在这里插入图片描述

3 多个程序文件的编译

在这里插入图片描述

4 检错

在这里插入图片描述
除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息:
在这里插入图片描述
在编译程序时带上-Werror 选项,那 么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改:
在这里插入图片描述

5 库文件连接

开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支 持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、或 lib、dll)的集合。

5.1 编译成可执行文件

首先我们要进行编译 test.c 为目标文件,这个时候需要执行 gcc –c –I /usr/dev/mysql/include test.c –o test.o
在这里插入图片描述

5.2 链接

最后我们把所有目标文件链接成可执行文件: gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test
在这里插入图片描述
Linux 下的库文件分为两大类分别是动态链接库(通常以.so 结尾)和静态链接库(通常以.a 结尾),二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。

5.3 强制链接时使用静态链接库

默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链 接库,如果需要的话可以在编译时加上-static 选项,强制使用静态链接库。
在这里插入图片描述
静态库链接时搜索路径顺序:

  1. ld 会去找 GCC 命令中的参数-L

  2. 再找 gcc 的环境变量 LIBRARY_PATH

  3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初 compile gcc 时写在程序内的 动态链接时、执行时搜索路径顺序:

  4. 编译目标代码时指定的动态库搜索路径

  5. 环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径

  6. 配置文件/etc/ld.so.conf 中指定的动态库搜索路径

  7. 默认的动态库搜索路径/lib

  8. 默认的动态库搜索路径/usr/lib

有关环境变量:
LIBRARY_PATH 环境变量:指定程序静态链接库文件搜索路径

LD_LIBRARY_PATH 环境变量:指定程序动态链接库文件搜索路径

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值