原文地址:https://www.cnblogs.com/wjchao/p/7460375.html
一、 gcc 编译过程
从 hello.c 到 hello(或 a.out)文件, 必须历经 hello.i、 hello.s、 hello.o,最后才得到 hello(或a.out)文件,分别对应着预处理、编译、汇编和链接 4 个步骤,整个过程如图 10.5 所示。
这 4 步大致的工作内容如下:
- 预处理: 去掉注释、头文件包含、宏替换、条件编译选择等。预处理参考
- 编译,将预处理得到的源代码文件,进行“翻译转换”,产生出机器语言的目标程序,得到机器语言的汇编文件;
- 汇编,将汇编代码翻译成了机器码,但是还不可以运行;
- 链接,处理可重定位文件,把各种符号引用和符号定义转换成为可执行文件中的合适信息,通常是虚拟地址。
下面根据 hello.c 这个示例,跟踪一下其中的细节。
//hello.c文件
#include <stdio.h>
#define MY_NUM 10
int main()
{
/* 我是一个 C 程序 */
printf("Hello, World! %d \n", MY_NUM);
return 0;
}
1.预处理
预处理,生成预编译文件(.i文件):
gcc -E hello.c -o hello.i
将会产生 hello.i 文件,这就是 hello.c 经过预处理后的文件。
一个原本连同空行才 8 行的代码,经过预处理,得到了一个 700 多行的预处理文件,文件开的内容如下图所示。
hello.i 头部
hello.i尾盘
其余部分内容请用 Vi 打开后进行查看。可以看到, hello.c 经过预处理后得到的 hello.i文件,除了原本的几行代码之外,还包含了很多额外的变量、函数等等,这些都是预处理器处理的结果。
2.编译
编译,生成汇编代码(.s文件):
gcc -S hello.i -o hello.s
可以看到,该文件内容都是汇编语句。这里不对汇编进行解释。
3.汇编
得到了汇编文件后,通过 gcc 就可以得到机器码了。在终端输入下列命令,可以得到hello.o 目标文件。
gcc -c hello.s -o hello.o
4.链接
尽管已经得到了机器码,但这个文件却还是不可以运行的,必须要经过链接才能得到可执行文件。
在终端输入下列命令,将会得到可执行文件 a.out。
gcc hello.o
a.out 是 gcc 默认输出文件名称,可以通过-o 参数指定新的文件名。例如加上“-o hello”参数,将会生成 hello 文件,这个文件和 a.out 实际上是一样的,用 md5sum 命令计算文件校验值,两者完全一样,如下图所示。
其他内容说明
上述代码中,我们并没有实现printf函数,那么printf函数是在哪实现的?
在上述程序中我们通过#include引入了系统头文件 <stdio.h>,系统头文件stdio.h中有printf函数的声明,系统将stdio.h还有一些其他头文件内的函数实现封到一个名为libc.so.6的库当中(即函数库)。
在程序完成编译后,就会进入链接阶段,编译器检测到你引入了系统头文件,就会隐式链接相应的函数库,所以在程序执行时,才可以正常输出。
这里有一个重要的概念:函数库。
函数库分为静态库和动态库。通常,对函数的链接是在编译期的时候完成的,所有相关的对象文件与相关联的library被链接成一个可执行文件,这就是使用静态库的编译过程,其后缀名一般为”.a”。而动态库技术:对一些库函数的链接载入推迟到程序运行的时候,其后缀名一般为".so"。
不管是使用静态库还是使用动态库,这些库文件都是由*.o文件生成的,给编译器gcc传不同的参数,就会生成相应的静态库或者是动态库了。
对于上面简单的小程序,预处理、编译、汇编、链接可以一步到位:
gcc hello.c
//默认生成a.out可执行文件
//也可以通过-o指定可执行文件名称
gcc hello.c -o hello