1.翻译环境和运行环境
在C语言中,代码从源文件到可执行程序之间都存在两个环境:翻译环境和运行环境。
翻译环境:在这个环境中源代码被转换为可执行的机器指令(二进制指令)。
运行环境:这个环境用于实际执行代码。
上图就是翻译环境和运行环境的一个大致关系。
2.翻译环境
我们知道了翻译环境能够将代码转换为二进制指令,那么它是怎么将代码转换为二进制指令的呢?
其实翻译环境是用编译和链接两个大过程组成的,编译又可以分为:预处理(预编译)、编译、汇编三个过程。
一个C语言项目中可能出现有多个源文件一起构建的情况,那多个源文件是怎么生成可执行程序的呢?
答案是:多个源文件单独经过编译后得到对应的目标文件。
注意:在Windows环境下的目标文件的后缀是.obj,Linux环境下的目标文件的后缀是.o。
多个目标文件和链接库一起经过链接器处理生成可执行程序。
链接库是指运行时库(支持程序运行的基本函数集合)或者第三方库。
如果再把编译器展开成三个过程就如下图所示:
2.1预处理阶段
在预处理阶段,源文件和头文件会被处理为.i为后缀的文件。
在gcc环境下观察的话需要用到命令:
gcc -E test.c -o test.i
gcc test.c -E -o test.i
以上两个命令都可以观察对test.c处理后的.i文件。
预处理阶段主要处理那些源文件中#开头的预处理指令。比如#include,#define,处理规则如下:
将所有的#define删除,并将所有的宏定义展开(替换)
处理所有的条件编译指令,如#if,#ifdef,#elif,#else,#endif
处理#include预编译指令,将包含的头文件的内容插入到这个预编译指令的位置,这个过程是可以递归进行的,也就是被包含的头文件也可能包含其他文件。
将所有的注释用空格替换掉
添加行号和文件名标识,方便后续编译器生成调试信息等
保留所有的#pragma的编译器指令,编译器后续会继续使用
经过预处理后的文件不在包含宏定义,因为宏已经被展开。并且包含的头文件都被插入到.i文件中,可以通过查看.i文件来确定宏定义和头文件的包含是否正确。
2.2编译阶段
编译阶段所做的内容就是将C语言代码翻译成汇代码
编译过程就是将预处理后的.i文件进行一系列的:词法分析,语法分析,语义分析以及优化,生成相应的汇编代码文件。
通过编译后会生成.s文件。
编译过程在gcc下的命令是:
gcc -S test.i -o test.s
gcc test.i -S -o test.s
词法分析:
C语言中的词法分析会将源文件代码输入扫描器,扫描器简单的进行词法分析,将代码中的字符分割成一系列的记号(关键字,标识符,字面量,特殊符号等)。
语法分析:
语法分析器对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树。如下图所示:
语义分析:
由语义分析器,来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。
2.3汇编
汇编器是将汇编代码转换位机器可执行的指令,每一条汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表一一的进行翻译,也不做指令优化。
在gcc汇编的命令如下:
gcc -C test.s -o test.o
汇编阶段主要做的内容是将汇编代码翻译成二进制的机器指令,生成.o目标文件。
2.4链接
链接是一个比较复杂的过程,链接的时候需要把一堆文件链接在一起生成一个可执行程序。
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是一个项目中多文件、多模块之间互相调用的问题。
如下有两个.c文件
.c文件1
#include <stdio.h>
extern int Add(int x, int y);
int main() {
int a=10;
int b=20;
int sum=Add(a,b);
printf("%d\n",sum);
return 0;
}
.c文件2
int Add(int x,int y)
{
return x+y;
}
每个源文件都单独经过编译器处理生成对应的目标文件。
test.c经过编译器处理生成test.o
add.c经过编译器生成add.o
3.运行环境
1.程序必须载入内存中。在有操作系统的环境中:一般这个有操作系统完成,在独立的环境中程序的载入需要手动,也可能是通过可执行代码置入只读内存来完成。
2.程序的执行开始,接着就开始调用main函数。
3.开始执行程序代码,这个时候程序进行函数栈帧,存储函数的局部变量和返回地址,同时程序使用静态内存,存储于静态内存中的变量在程序的整个执行过程中一直保留值。
4.程序终止,正常或者意外终止。
以上就是这篇博客的全部内容,希望有所帮助。