什么是编译器?什么是链接器?
编译器
代码都是文本信息,电脑没办法直接执行文本信息,而编译器的作用就是要对这些代码进行处理,转换为可执行的机器指令(二进制指令)。
链接器
链接器就是把多个目标文件链接在一起,生成可执行程序
正文开始:
1.翻译环境和运行环境
在ANSI C的任何一种实现中,存在两个不同的环境
1.翻译环境 : 在这个环境中源代码(.c)被转换为可执行的机器指令(二进制指令)
2.执行环境 : 执行环境用于实际执行代码
2.翻译环境
翻译环境由“编译”和“链接”两部分组成
.c文件经过编译器生成 .obj(目标文件)
.obj文件又经过链接器生成 .exe(可执行程序)
而编译器又可分解为:预处理(预编译),编译 , 汇编三个过程
一个C语言的项目中可能又多个.c文件,多个.c文件如何生成可执行程序呢?
。多个.c文件单独经过编译器,编译处理生成对应的目标文件
。Windows环境下的目标文件后缀是 .obj
linux 环境下的目标文件后缀是 .o
。多个目标文件和链接库一起经过链接器处理生成最终的可执行程序
。链接库是指运行时库(它是支持程序运行的基本函数集合)或第三方库
2.1预处理(预编译)
在预处理阶段,源文件和头文件会被处理为.i为后缀的文件
预处理阶段主要处理那些源文件中#开始的预编译指令,比如:#include , #define ,处理规则如下:
。将所有#define删除,并展开所有宏定义
。处理所有条件编译指令,如:#if ,#ifdef ,#elif , #else , #endif
。处理#include预编译指令,将头文件中包括的内容插入到该预编译指令的位置,
比如:#includ<stdio.h>在第一行,就从第一行开始展开,这个过程是递归进行的,也就是说包含的头文件也可能包含其他文件
。删除所有注释
。添加行号和文件名标识(当有多个文件时方便识别是哪个文件的),方便生成调试信息
。保留所有#pragma的编译器指令,编译器后续会使用
2.2编译
编译过程就是将预处理后的文件进行一系列的 词法分析,语法分析 ,语义分析 及 优化,生成相应的汇编代码文件
对下面的代码进行编译时,会怎么做呢?
1. array[index] = (index+4)*(2+6);
2.2.1 词法分析
将代码输入扫描器,进行词法分析,把代码中的一系列字符分成一个个的记号,上面的代码进行词法分析后得到了16个记号
2.2.2语法分析
接下来语法分析器,将对扫描产⽣的记号进⾏语法分析,从⽽产⽣语法树。这些语法树是以表达式为节点的树。
2.2.3语义分析
由语义分析器来完成语义分析,即对表达式的语法层⾯分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。
语义标识后的语法树
3.汇编
汇编器是将汇编代码转转变成机器可执⾏的指令,每⼀个汇编语句⼏乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表⼀⼀的进⾏翻译,也不做指令优化。
4.链接
翻译完汇编后生成.o为后缀的文件,链接阶段就是把多个.o(目标文件) 链接在一起生成.exe(可执行程序)
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是⼀个项⽬中多⽂件、多模块之间互相调⽤的问题。
3.运行环境
1. 程序必须载⼊内存中。在有操作系统的环境中:⼀般这个由操作系统完成。在独⽴的环境中,程序的载⼊必须由⼿⼯安排,也可能是通过可执⾏代码置⼊只读内存来完成。
2. 程序的执⾏便开始。接着便调⽤main函数。
3. 开始执⾏程序代码。这个时候程序将使⽤⼀个运⾏时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使⽤静态(static)内存,存储于静态内存中的变量在程序的整个执⾏过程⼀直保留他们的值。
4. 终⽌程序。正常终⽌main函数;也有可能是意外终⽌。
关于编译和链接的知识就讲到这里,下篇见!!!