翻译环境和运行环境
在ANSI C的任何⼀种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令(二进制指令)。
第2种是执行环境,它用于实际执行代码。
我们写完一个程序后,为了能在系统上运行这个程序,程序中的每一个语句都要经过一系列“翻译”的手段转化成机器能理解的二进制的指令,然后再通过一系列的指令使其变成可执行目标程序。
在Unix系统上,从源文件到目标文件的转化是由编译器驱动程序完成的。
翻译环境
我们现在来详细说明翻译环境是如何将源代码转化为可执行的机器指令。
翻译环境是由编译和链接两大过程组成的,而编译又可以分解成:预编译,编译,汇编三个部分。
⼀个C语言的项目中可能有多个 .c 文件⼀起构建,那多个 .c 文件如何生成可执行程序呢?
• 多个.c文件单独经过编译器,编译处理生成对应的目标文件。
• 注:在Windows环境下的目标文件的后缀是 .obj ,Linux环境下的后缀目标文件是 .o
• 多个目标文件和链接库⼀起经过链接器处理生成最终的可执行程序。
• 链接库是指运行时库(它是支持程序运行的基本函数集合)或者第三方库。
编译
预编译
在预处理阶段,源文件和头文件都会被处理成后缀为.i的文件。
在gcc中可以用以下命令来进行预处理
gcc -E hello.c -o hello.i
预处理的规则如下:
• 将所有的 #define 删除,并展开所有的宏定义。
• 处理所有的条件编译指令,如: #if、#ifdef、#elif、#else、#endif 。
•处理#include 预编译指令,将包含的头文件的内容插⼊到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。
• 删除所有的注释
• 添加行号和文件名标识,方后续编译器生成调试信息等。
• 或保留所有的#pragma的编译器指令,编译器后续会使用。
编译
编译过程就是将预处理后的文件进行⼀系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。
编译过程的命令如下:
gcc -S test.i -o test.s
词法分析
扫描器(Scanner)将源代的字符序列分割成一系列的记号(Token)。
语法分析
语法分析器将记号(Token)产生语法树(Syntax Tree)。yacc工具可实现语法分析(yacc: Yet Another Compiler Compiler)。
语义分析
静态语义(在编译器可以确定的语义)、动态语义(只能在运行期才能确定的语义)。
汇编
汇编器是将汇编代码转转变成机器可执行的指令,每⼀个汇编语句几乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表⼀⼀的进行翻译,也不做指令优化。
汇编的命令如下:
gcc -c test.s -o test.o
链接
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
我们都知道每个源文件是单独经过处理形成的目标文件。
当我们在文件中使用了另一个文件中的函数,而使用函数时又必须知道函数的地址。但由于每个文件是单独编译的,此时这个文件并不知晓其调用函数的地址,所以只能暂且搁置。等到最后链接时再将其所调用的函数的地址进行修正,使它成为函数真正的地址。而这个地址修正的过程被称为重定位
这里只对编译与链接进行了简单的描述,若想要进一步更深层次的理解,可以看《程序的自我修养》这本书。
运行环境
1. 程序必须载入内存中。在有操作系统的环境中:⼀般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
2. 程序的执行便开始。接着便调用main函数。
3. 开始执行程序代码。这个时候程序将使用⼀个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。
4. 终止程序。正常终止main函数;也有可能是意外终止。
感谢您的阅读!