在ANSI C的任何一种实现中,存在两个不同的环境。
第一个是翻译环境,将源代码翻译为机器指令(二进制指令)
第二个是执行环境,执行翻译后的机械指令(二进制指令)
翻译环境
翻译环境又由编译和链接两大过程组成。
编译
编译又可以分为预处理、编译、汇编三个过程
预处理(预编译)
在预处理阶段,源⽂件和头⽂件会被处理成为 .i 为后缀的⽂件。
预处理阶段主要处理那些源⽂件中#开始的预编译指令。
处理的规则如下:
• 将所有的 #define 删除,并展开所有的宏定义。
• 处理所有的条件编译指令,如: #if、#ifdef、#elif、#else、#endif 。
• 处理#include 预编译指令,将源代码中包含的头⽂件的内容插⼊到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头⽂件中也可能包含其他⽂件。
• 删除所有的注释
• 添加⾏号和⽂件名标识,⽅便后续编译器⽣成调试信息等。
• 保留所有的#pragma的编译器指令,编译器后续会使⽤。
编译
编译就是将预处理后的文件,通过一系列词句分析、语句分析、语义分析和优化,将文件处理成相应的汇编代码文件
词句分析
将源代码中的符号分割为一系列的关键字、标识符、字⾯量、特殊字符等
array[index] = (index+4)*(2+6);
记号 | 类型 |
array | 标识符 |
[ | 左方括号 |
index | 标识符 |
] | 右方括号 |
= | 赋值 |
( | 左圆括号 |
index | 标识符 |
+ | 加号 |
4 | 数字 |
) | 右圆括号 |
* | 乘号 |
( | 左圆括号 |
2 | 数字 |
+ | 加号 |
6 | 数字 |
) | 右圆括号 |
语句分析
对记号进行分析,并生成语法树。语法树以表达式为节点。
语义分析和优化
由语义分析器对表达式的语法层面分析,编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。
汇编
汇编器将汇编代码处理成机器指令,根据汇编指令和机器指令的对照表一一进行翻译,一条汇编语句几乎都对应一条机器指令,且不做指令优化。
链接
链接解决的是⼀个项⽬中多⽂件、多模块之间互相调⽤的问题,通过地址和空间分配,符号决议和重定位等步骤,将一堆文件链接在一起生成可执行程序。
多个.c文件只能单独进行编译处理产生对于的目标文件
在Windows环境下的⽬标⽂件的后缀是.obj,Linux环境下⽬标⽂件的后缀是.o
多个目标文件和链接库通过链接器处理生成最终的可执行文件
执行环境
在有操作系统的环境中,程序载入内存⼀般由操作系统完成。在独立的环境中,程序的载⼊必须手动将载入内存,或者通过可执⾏代码置⼊只读内存来完成。
执⾏程序代码的时候程序将使用一个运行时堆栈,存储函数的局部变量和返回地址。同时程序也可以使⽤静态内存,存储于静态内存中的变量在程序的整个执⾏过程 ⼀直保留他们的值。