编译环境和运行环境
任何一个ANSI C的任何一种实现中,存在两个不同的环境。
- 翻译环境,在这个环境中,源代码被转换成为机器指令(二进制指令)
- 运行环境,它用于实际执行代码
本篇文章是关于编译环境中步骤的简单讲解的,了解都有哪些步骤。
那么一个C语言的源代码是如何转换为机器可读懂的机器指令的呢?
编译环境
可以分为以下四个步骤:
预处理->test.i test.i - 编译 ->test.s test.o(目标文件)- 汇编 -> test.o
链接,多个test.o通过链接器生成一个可执行程序
由于vs2022是一种集成开发环境,不太好观察每一个步骤,所以我们使用vscode来演示每一个步骤生成的文件。
1.预处理(预编译)
在预处理阶段,源文件和头文件会被处理为test.i文件
在gcc环境下想观察预处理之后的test.i文件,可以执行下面的指令
gcc -E test.c -o -test.i
-E就是预处理
-o则是生成一个目标文件test.i
这里我们以简单的加法函数来举例,函数声明和定义分别放到了add.h和add.c中。
当我们输入指令后,会产生以个test.i文件
此时我们观察test.i与test.c的不同,发现test.c中仅仅10几行代码而test.i中却有将近1000行代码。
预处理阶段主要处理那些源文件中**#开始的预编译指令**。比如:#include,#define,处理的规则如下:
- 将所有的#define 删除,并展开所有的宏定义。
- 处理所有的条件编译指令,如: #if、#ifdef、#elif、#else、#endif 。
- 处理#include预编译指令,将包含的头文件的内容插⼊到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。
- 删除所有的注释
- 添加行号和文件名标识,方便后续编译器⽣成调试信息等。
- 或保留所有的**#pragma**的编译器指令,编译器后续会使用。
经过预处理后的.i文件中不再包含宏定义,因为宏已经被展开。并且包含的头文件都被插入到.i文件中。所以当我们无法知道宏定义或者头文件是否包含正确的时候,可以查看预处理后的.i文件来确认
2.编译
编译则是将预处理完后的文件进行一系列的词法分析,语法分析,语义分析及优化后产生相应的汇编代码,也是整个过程最复杂的部分,这里就不过多介绍了,有兴趣可以去看一看《程序员的自我修养》这本书,里面有详细的讲解。
执行命令为:
gcc -S test.i此时后面不用写-o会自动生成test.s文件
3.汇编
汇编就相对简单一点了,汇编就是把编译完产生的汇编代码翻译为机器指令就ok了,每一条汇编代码对应一条机器指令,按照和机器指令的对照表一一翻译就可以了。
执行命令
gcc -c test.c -o test.o
这里使用vs2022的二进制编译器打开看看文件内容
4.链接
链接是⼀个复杂的过程,链接的时候需要把⼀堆文件链接在⼀起才生成可执⾏程序。
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是⼀个项目中多文件、多模块之间互相调用的问题。
结言
本文只是简略的讲解了在我们c语言源代码生成可执行程序的过程中都会进行哪些必要的步骤,想要详细了解的可以查阅《程序员的自我修养》这本书深入理解。