目录
1 gcc常用命令
1.1 简介
GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL 语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语 言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另 一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。
1.2 简单编译
示例程序如下:
test.c
#include <stdio.h>
int main(void)
{
printf("hello world!\n");
return 0;
}
这个程序,一步到位的编译指令是
gcc test.c -o test
实质上,上述编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 (Compilation)、汇编 (Assembly)和连接(Linking)。
1.2.1 预处理
gcc -E test.c -o test.i
或 gcc -E test.c
前一条命令可以输出 test.c 经预处理之后的代码,将其存放在test.i文件中。
后一条命令,是直接在命令行窗口种输出预处理后的代码。
1.2.2 编译为汇编代码(Compilation)
预处理后,可直接对生成的test.i
文件编译,生成汇编代码
gcc -S test.i -o test.s
gcc 的-S 选项,表示在程序编译期间,在生成汇编代码后,停止,-o 输出汇编代码文件.
1.2.3 汇编(Assembly)
对于上一小节中生成的汇编代码文件 test.s,gas 汇编器负责将其编译为目标文件
gcc -c test.s -o test.o
1.2.4 连接(Linking)
gcc 连接器是 gas 提供的,负责将程序的目标文件与所需的所有附加的目标文件连接起来,最终生成可执行文件。附加的目标文件包括静态连接库和动态连接库。
对于上一小节中生成的 test.o,将其与C标准输入输出库进行连接,最终生成程序 test
gcc test.o -o test
执行./test,获得输出
1.3 多个程序文件的编译
通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用 GCC 能够很好地管理 这些编译单元。假设有一个由 test1.c 和 test2.c 两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序 test,可以使用下面这条命令:
gcc test1.c test2.c -o test
如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下三条命令:
gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o
1.4 检错
gcc -pedantic illcode.c -o illcode
-pedantic
编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助 Linux 程序员离这个目标越来越近。或者换句话说,-pedantic
选项能够帮助程序员发现一些不符合 ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。
除了-pedantic
之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W 开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。
gcc -Wall illcode.c -o illcode
gcc给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror
选项,那 么 gcc 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:
gcc -Werror test.c -o test
1.5 库文件连接
在上一篇文章中,已经详细的介绍了gcc生成与使用静态库与动态库,本文不再讲述。
2 gcc编译器背后的故事
GCC 不是一个人在战斗,GCC 背后其实有一堆战友。
2.1 gcc编译器的工具
- gcc
GCC(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++
语言编写的程序转换成为处理器能够执行的二进制代码的过程即由编译器完成。
- Binutils
一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、 ldd、readelf、 size 等。这一组工具是开发和调试不可缺少的工具。4
- C运行库
C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库。 C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类 型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义 在 stdio 头文件中。 C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译 器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又 常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支 持库,称为 C++运行时库。
2.2 分析ELF文件
下面将仍以test.c
文件进行分析。
2.2.1 ELF文件的段
ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都 是段(Section)。一个典型的 ELF 文件包含下面几个段: .text:已编译程序的指令代码段。
- rodata:ro 代表 read only,即只读数据(譬如常数 const)。
- data:已初始化的 C 程序全局变量和静态局部变量。
- bss:未初始化的 C 程序全局变量和静态局部变量。
- debug:调试符号表,调试器用此段的信息帮助调试。
可以使用readelf -S
查看其各个 section 的信息如下:
2.1.2 反汇编ELF
由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。 使用 objdump -D
对其进行反汇编如下:
objdump -D test > test.txt
使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示
gcc -o hello -g hello.c //要加上-g 选项
objdump -S hello