1. 编译和链接
我们日常编写的C程序从编写到执行的过程中共同依靠着翻译环境和运行环境。
那么什么是翻译环境呢?什么又是运行环境呢?
1.1 翻译环境和运行环境
#翻译环境: 将我们人为能够理解的源代码(高级编程语言)转换为可执行机器所能够理解的机器指令(二进制指令)的过程,我们称之为翻译环境。也就是我们日常C语言中的源文件(.c)和头文件(.h)通过编译、链接
生成可执行文件(.exe)的过程
#运行环境: 将程序载入内存,实际执行程序并将程序运行的过程叫做运行环境
1.2 翻译环境
根据上面的图,我们可以得知翻译环境主要是由编译和链接两个过程组成的,在编译阶段又可分为:预编译(也就是我们常说的预处理)、编译、汇编三个过程。
在我们创建的一个C语言项目中可能存在多个.c
的源文件,那么这么多个.c
文件如何构建成我们的可执行程序呢?(多个文件的翻译环境如何执行)
- (第一步)不仅对于单个
.c
文件经过编译器会生成对应的目标文件,同样的对于多个.c
文件也会单独进行编译处理形成各自对应的目标文件- (第二步)多个目标文件(.obj)和链接库一起经过链接器处理最终生成可执行文件(.exe)
注意:
- 链接库:链接库是指运行时库(它是支持程序运行的基本函数集合)或者第三方库
- 在不同环境下的目标文件的后缀不同,如:在windows环境下的目标文件后缀为
.obj
,在Linux环境下的目标文件后缀为.o
细分编译阶段过程和链接过程,就可以以下面的图来描述我们整个翻译环境:
1. 预编译(预处理)
预处理阶段会将源文件和头文件处理成为.i
为后缀的中间文件。在gcc
环境下想要观察这个预编译阶段产生的中间文件,我们可以采用以下命令:
gcc -E xxx.c(对应的文件名) -o xxx.i(生成对应文件的中间文件)
那么对于预处理阶段我们主要操作的是什么呢?
预处理阶段我们主要处理源文件中以#
开头的预编译指令:
- 展开宏定义:编译器会查找源文件中所有被
#define
定义的宏,将这些宏定义替换成对应的值或代码片段。- 处理所有
#include
预处理指令将包含的头文件内容插入到该预处理指令的位置。这里我们要注意的是被包含的头文件中也可能包含其他的头文件,也就是说这个过程可以一直展开(递归)
- 条件编译指令的处理,如:
#if
、#ifdef
、#elif
、#else
、#endif
这些可以根据指定条件(通常是宏定义)决定是否执行的代码- 删除所有的注释,预处理后的代码不存在注释信息。
- 添加行号和文件名标识(便于编译器生成调试信息),保留所有的
#pragma
的编译器指令,便于编译器后续使用
2. 编译
经过预编译后,我们的.c
文件会被处理为.i
文件,那么编译时是对那些内容进行操作的呢?编译过程就是将预处理后的文件进行一系列的词法分析、语法分析、语义分析及优化的过程,并最终生成相对应的汇编代码文件过程。
将预编译阶段生成的.i
文件转换为相应的汇编代码.s
文件的命令如下:
gcc -S xxx.i(对应的文件名) -o xxx.s
3. 汇编
汇编的过程是将编译生成的汇编代码文件转化为机器可执行的指令的过程,也就是说将.s
文件–>.o
文件(汇编代码文件–>目标文件)。每一条汇编语句几乎都有与之相对应的一条机器指令。(根据汇编指令和机器指令对照表–进行翻译,不做优化)
汇编代码文件转换为目标文件的命令:
gcc -c xxx.s(相对应的文件名) -o xxx.o
4. 链接
如一开始的图所示,链接就是讲一堆目标文件和链接库一同链接在一起生成可执行程序的过程。主要解决一个项目中多个文件的交互的问题。
1.3 运行环境
运行环境中主要进行以下操作:
第一步:将程序载入内存中。
在拥有操作系统的环境中,这个操作将由操作系统自动进行。在独立环境中,这个程序载入内存的过程中必须手动操作执行,或是通过可执行代码植入制度内存来完成
第二步:开始执行程序,找到程序的入口
main()
函数
第三步:使用运行时堆栈(stack)存储函数的局部变量和返回地址等。也可以同时使用静态(static)内存,存储在这个内存中的变量的生命周期贯穿这个程序的运行过程。
第四步:结束程序。(可以是正常执行完main()函数,也可以是程序错误崩溃,提前终止)