Linux GCC 常用命令和 GCC编译器背后的故事

最新推荐文章于 2023-01-06 16:34:16 发布

斯蒂芬蛋黄

最新推荐文章于 2023-01-06 16:34:16 发布

阅读量201

点赞数

文章标签： linux c# 运维

本文链接：https://blog.csdn.net/m0_50257213/article/details/126981404

版权

一、Linux GCC 常用命令

1.简介

GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展，GCC 已经不仅仅能支持 C
语言；它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL
语言，以及支持函数式编程和逻辑编程的 Mercury 语言，等等。而 GCC 也不再单只是 GNU C 语
言编译器的意思了，而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另
一方面，说到 GCC 对于操作系统平台及硬件平台支持，概括起来就是一句话：无所不在。

2.简单编译

例如以下程序：
test.c:

#include<stdio.h>
int main()
{
printf("Hello world!\n");
return 0;
}

这个程序，一步到位的编译指令是：

gcc test.c -o test

编译、运行：
在这里插入图片描述

实质上，上述编译过程是分为四个阶段进行的，即预处理(也称预编译，Preprocessing)、编译
(Compilation)、汇编 (Assembly)和连接(Linking)。

2.1预处理

gcc -E test.c -o test.i

或者

gcc -E test.c

预处理之后，会产生test.i文件

在这里插入图片描述

2.2 编译为汇编代码(Compilation)

预处理之后，可直接对生成的 test.i 文件编译，生成汇编代码：

gcc -S test.i -o test.s

gcc 的-S 选项，表示在程序编译期间，在生成汇编代码后，停止，-o 输出汇编代码文件。

多了一个test.s文件

在这里插入图片描述

2.3汇编(Assembly)

对于上一小节中生成的汇编代码文件 test.s，gas 汇编器负责将其编译为目标文件，如下：

gcc -c test.s -o test.o

又多了一个test.o文件

在这里插入图片描述

2.4连接(Linking)

gcc 连接器是 gas 提供的，负责将程序的目标文件与所需的所有附加的目标文件连接起来，最终生
成可执行文件。附加的目标文件包括静态连接库和动态连接库。
对于上一小节中生成的 test.o，将其与Ｃ标准输入输出库进行连接，最终生成程序 test。

gcc test.o -o test

在这里插入图片描述
执行运行命令：./test

3.多个文件编译

通常整个程序是由多个源文件组成的，相应地也就形成了多个编译单元，使用 GCC 能够很好地管理
这些编译单元。假设有一个由 test1.c 和 test2.c 两个源文件组成的程序，为了对它们进行编译，并
最终生成可执行程序 test，可以使用下面这条命令：

gcc test1.c test2.c -o test

如果同时处理的文件不止一个，GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起
来，上面这条命令大致相当于依次执行如下三条命令：

gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test

4.检错

gcc -pedantic illcode.c -o illcode

-pedantic 编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容，它仅仅只能用来帮助
Linux 程序员离这个目标越来越近。或者换句话说，-pedantic 选项能够帮助程序员发现一些不符合
ANSI/ISO C 标准的代码，但不是全部，事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的
那些情况，才有可能被 GCC 发现并提出警告。

除了-pedantic 之外，GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W
开头，其中最有价值的当数-Wall 了，使用它能够使 GCC 产生尽可能多的警告信息。

gcc -Wall illcode.c -o illcode

GCC 给出的警告信息虽然从严格意义上说不能算作错误，但却很可能成为错误的栖身之所。一个优
秀的 Linux 程序员应该尽量避免产生警告信息，使自己的代码始终保持标准、健壮的特性。所以将
警告信息当成编码错误来对待，是一种值得赞扬的行为！所以，在编译程序时带上-Werror 选项，那
么 GCC 会在所有产生警告的地方停止编译，迫使程序员对自己的代码进行修改，如下：

gcc -Werror test.c -o test

5.库文件连接

开发软件时，完全不使用第三方函数库的情况是比较少见的，通常来讲都需要借助许多函数库的支
持才能够完成相应的功能。从程序员的角度看，函数库实际上就是一些头文件（.h）和库文件（so、或 lib、dll）的集合。。虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下，而库文
件则放到/usr/lib/目录下；Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib，
以及系统文件夹下。但也有的时候，我们要用的库不再这些目录下，所以 GCC 在编译时必须用自己
的办法来查找所需要的头文件和库文件。

例如我们的程序 test.c 是在 linux 上使用 c 连接 mysql，这个时候我们需要去 mysql 官网下载 MySQL
Connectors 的 C 库，下载下来解压之后，有一个 include 文件夹，里面包含 mysql connectors 的头
文件，还有一个 lib 文件夹，里面包含二进制 so 文件 libmysqlclient.so
其中 inclulde 文件夹的路径是/usr/dev/mysql/include,lib 文件夹是/usr/dev/mysql/lib

5.1编译成可执行文件

首先我们要进行编译 test.c 为目标文件，这个时候需要执行

gcc –c –I /usr/dev/mysql/include test.c –o test.o

5.2 链接

最后我们把所有目标文件链接成可执行文件:

gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test

Linux 下的库文件分为两大类分别是动态链接库（通常以.so 结尾）和静态链接库（通常以.a 结尾），
二者的区别仅在于程序执行时所需的代码是在运行时动态加载的，还是在编译时静态加载的。

5.3 强制链接时使用静态链接库

默认情况下， GCC 在链接时优先使用动态链接库，只有当动态链接库不存在时才考虑使用静态链
接库，如果需要的话可以在编译时加上-static 选项，强制使用静态链接库。

在/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.so 和 libmysqlclient.a，为了让
GCC 在链接时只用到静态链接库，可以使用下面的命令:

gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test

静态库链接时搜索路径顺序：

ld 会去找 GCC 命令中的参数-L
再找 gcc 的环境变量 LIBRARY_PATH
再找内定目录 /lib /usr/lib /usr/local/lib 这是当初 compile gcc 时写在程序内的

动态链接时、执行时搜索路径顺序:

编译目标代码时指定的动态库搜索路径

环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径

配置文件/etc/ld.so.conf 中指定的动态库搜索路径

默认的动态库搜索路径/lib

默认的动态库搜索路径/usr/lib

有关环境变量：LIBRARY_PATH环境变量：指定程序静态链接库文件搜索路径LD_LIBRARY_PATH环境变量：指定程序动态链接库文件搜索路径

二、GCC编译器背后的故事

GCC 不是一个人在战斗，GCC 背后其实有一堆战友。

GCC

GCC（GNU C Compiler）是编译工具。本文所要介绍的将 C/C++语言编写的程序
转换成为处理器能够执行的二进制代码的过程即由编译器完成。

Binutils：

一组二进制程序处理工具，包括：addr2line、ar、objcopy、objdump、as、ld、
ldd、readelf、 size 等。这一组工具是开发和调试不可缺少的工具，分别简介
如下：

(1) addr2line：用来将程序地址转换成其所对应的程序源文件及所对应的代码
行，也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对
应的源代码位置。

(2) as：主要用于汇编，有关汇编的详细介绍请参见后文。

(3) ld：主要用于链接，有关链接的详细介绍请参见后文。

(4) ar：主要用于创建静态库。为了便于初学者理解，在此介绍动态库与静态库
的概念：

如果要将多个 .o 目标文件生成一个库文件，则存在两种类型的库，一种是静态库，另一种是动态库。
在windows 中静态库是以 .lib 为后缀的文件，共享库是以 .dll 为后缀的文件。在 linux 中
静态库是以 .a 为后缀的文件，共享库是以 .so 为后缀的文件。
静态库和动态库的不同点在于代码被载入的时刻不同。静态库的代码在编译过程中已经被载入可执行程序，因此体积较大。共享库的代码是在可执行程序运行时才载入内存的，在编译过程中仅简单的引用，因此代码体积较小。在 Linux 系统中，可以用 ldd 命令查看一个可执行程序依赖的共享库。
如果一个系统中存在多个需要同时运行的程序且这些程序之间存在共享库，那么采用动态库的形式将更节省内存。

(5) ldd：可以用于查看一个可执行程序依赖的共享库。
(6) objcopy：将一种对象文件翻译成另一种格式，譬如将.bin 转换成.elf、或
者将.elf 转换成.bin 等。
(7) objdump：主要的作用是反汇编。有关反汇编的详细介绍，请参见后文。
(8) readelf：显示有关 ELF 文件的信息，请参见后文了解更多信息。
(9) size：列出可执行文件每个部分的尺寸和总尺寸，代码段、数据段、总大小
等，请参见后文了解使用 size 的具体使用实例。

C运行库

C 语言标准主要由两部分组成：一部分描述 C 的语法，另一部分描述 C 标准库。
C 标准库定义了一组标准头文件，每个头文件中包含一些相关的函数、变量、类
型声明和宏定义，譬如常见的 printf 函数便是一个 C 标准库函数，其原型定义
在 stdio 头文件中。
C 语言标准仅仅定义了 C 标准库函数原型，并没有提供实现。因此，C 语言编译
器通常需要一个 C 运行时库（C Run Time Libray，CRT）的支持。C 运行时库又
常简称为 C 运行库。与 C 语言类似，C++也定义了自己的标准，同时提供相关支
持库，称为 C++运行时库。

准备工作

由于 GCC 工具链主要是在 Linux 环境中进行使用，因此本文也将以 Linux 系统作
为工作环境。为了能够演示编译的整个过程，先创建一个工作目录 test0,然后
用文本编辑器生成一个 C 语言编写的简单 Hello.c 程序为示例，其源代码如下所
示：

#include <stdio.h>
//此程序很简单，仅仅打印一个 Hello World 的字符串。
int main(void)
{
printf("Hello World! \n");
return 0;
}

预处理

预处理主要包含以下过程：
(1) 将所有的#define 删除，并且展开所有的宏定义，并且处理所有的条件预编
译指令，比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令，将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识，以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令，后续编译过程需要使用它们。

编译

编译过程就是对预处理完的文件进行一系列的词法分析，语法分析，语义分析及
优化后生成相应的汇编代码。

汇编

汇编过程调用对汇编代码进行处理，生成处理器能识别的指令，保存在后缀为.o
的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令，因此，汇编相
对于编译过程比较简单，通过调用 Binutils 中的汇编器 as 根据汇编指令和处理
器指令的对照表一一翻译即可。
当程序由多个源代码文件构成时，每个文件都要先完成汇编工作，生成.o 目标
文件后，才能进入下一步的链接工作。注意：目标文件已经是最终程序的某一部
分了，但是在链接之前还不能执行。

链接

链接也分为静态链接和动态链接，其要点如下：
(1) 静态链接是指在编译阶段直接把静态库加入到可执行文件中去，这样可执行
文件会比较大。链接器将函数的代码从其所在地（不同的目标文件或静态链
接库中）拷贝到最终的可执行程序中。为创建可执行文件，链接器必须要完
成的主要任务是：符号解析（把目标文件中符号的定义和引用联系起来）和
重定位（把符号定义和内存地址对应起来然后修改所有对符号的引用）。

(2) 动态链接则是指链接阶段仅仅只加入一些描述信息，而程序执行时再从系统
中把相应动态库加载到内存中去。

分析 ELF 文件

1.ELF 文件的段

ELF 文件格式如下图所示，位于 ELF Header 和 Section Header Table 之间的都
是段（Section）。一个典型的 ELF 文件包含下面几个段：
.text：已编译程序的指令代码段。
.rodata：ro 代表 read only，即只读数据（譬如常数 const）。
.data：已初始化的 C 程序全局变量和静态局部变量。
.bss：未初始化的 C 程序全局变量和静态局部变量。
.debug：调试符号表，调试器用此段的信息帮助调试。
在这里插入图片描述

2.反汇编 ELF

由于 ELF 文件无法被当做普通文本文件打开，如果希望直接查看一个 ELF 文件包
含的指令和数据，需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编如下：

$ objdump -D hello

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来：

$ gcc -o hello -g hello.c //要加上-g 选项
$ objdump -S hello

斯蒂芬蛋黄

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Linux GCC 常用命令和 GCC编译器背后的故事

文章目录

一、Linux GCC 常用命令

1.简介

2.简单编译

2.1预处理

2.2 编译为汇编代码(Compilation)

2.3汇编(Assembly)

2.4连接(Linking)

3.多个文件编译

4.检错

5.库文件连接

5.1编译成可执行文件

5.2 链接

5.3 强制链接时使用静态链接库

二、GCC编译器背后的故事

GCC

Binutils：

C运行库

准备工作

预处理

编译

汇编

链接

分析 ELF 文件

1.ELF 文件的段

2.反汇编 ELF