编译过程的五个阶段

编译程序的工作,从输入源程序开始到输出目标程序为止的整个过程,是非常复杂的。但就其过程而言,它与人们进行自然语言直接的翻译有许多相近之处。当我们把一种文字翻译为另一种文字,例如把一段英文翻译为中文时,通常需经下列步骤:

(1)识别出句子中的一个个单词;

(2)分析句子的语法结构;

(3)根据句子的含义进行初步翻译;

(4)对译文进行修饰;

(5)写出最后的译文。

类似地,编译程序的工作过程一般也可以划分为五个阶段:词法分析、语法分析、语义分析与中间代码产生、优化、目标代码生成。

第一阶段:词法分析

词法分析的任务是:输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个的单词(亦称单词符号或简称符号),如基本字(begin、end、if、for、while),标识符、常数、运算符和界符(标点符号、左右括号)。

单词符号是语言的基本组成成分,是人们理解和编写程序的基本要素。识别和理解这些要素无疑也是翻译的基础。如同将英文翻译成中文的情形一样,如果你对英语单词不理解,那就谈不上进行正确的翻译。在词法分析阶段的工作中所依循的是语言的词法规则(或称构词规则)。描述词法规则的有效工具是正规式和有效自动机。

第二阶段:语法分析

语法分析的任务是:在词法分析的基础上,根据语言的语法规则,把单词符号串分解成各类语法单位(语法范畴),如“短语”、“句子”、“程序段”和“程序”等。通过语法分析,确定整个输入串是否构成语法上正确的“程序”。语法分析所依循的是语言的语法规则。语法规则通常用上下文无关文法描述。词法分析是一种线性分析,而语法分析是一种层次结构分析。例如:

Z = X + 0.618 * Y;

代表一个“赋值语句”,而其中的X + 0.618 * Y 代表一个“算术表达式”。因而,语法分析的任务就是识别X + 0.618 * Y为算术表达式,同时,十倍上述整个符号串属于赋值语句这个范畴。

第三阶段:词义分析与中间代码产生

这一阶段的任务是:对语法分析所识别出的各类语法范畴,分析其含义,并进行初步翻译(产生中间代码)。这一阶段通常包含两个方面的工作。首先,对每种语法范畴进行语义i安插,例如,变量是否定义、类型是否正确等等。如果语义正确,则进行另一方面工作,即进行中间代码的解释。这一阶段所依循的是语言的语义规则。通常使用属性文法描述语义规则。

“翻译”仅仅在这里才开始涉及到。所谓“中间代码”是一种含义明确、便于处理的记号系统,它通常独立于具体的硬件。这种记号系统或者与现代计算机的指令形式有某种程度的接近,或者能够比较容易地把它变换成现代计算机的机器指令。例如,许多编译程序采用了一种与“三地址指令”非常近似的“四元式”作为中间代码。这种寺院是的形式是:

算符左操作数右操作数结果

 

它的意义是:对“左右操作数”进行某种运算(由“算符”指明),把运算所得的值作为“结果”保留下来。在采用四元式作为中间代码的情形下,中间代码产生的任务就是按语言的语法规则把各类范畴翻译成四元式序列。例如,下面的赋值语句

Z = (X + 0.418) * Y / W;

可被翻译为如下的四元式序列:

image

其中,T1和T2是编译期间引进的临时工作变量;第一个四元式意味着把X的值加上0.418存放在T1中;第二个四元式值将T1的值和Y的值相乘存于T2中;第三个四元式指将T2的值除以Y的值留结果于Z中。

一般而言,中间代码是一种独立于具体硬件的记号系统。常用的中间大妈,除了四元式之外,还有三元式、间接三元式、逆波兰记号和树形表示等等。

第四阶段:优化

优化的任务在于对前段产生的中间代码进行加工变换,以期在最后阶段能产生出更为高效(省时间和空间)的目标代码。优化的主要方面有:公关子表达式的提取、循环优化、删除无用代码等等。有时,为了便于“并行运算”,还可以对代码进行并行化处理。优化所依循的原则是程序的等价变换规则。

第五阶段:目标代码生成

这一阶段的任务是:把中间代码(或经优化处理之后)变换成特定机器上的低级语言代码。这阶段实现了最后的翻译,它的工作有赖于硬件系统结构和机器指令含义。这阶段工作非常复杂,设计到硬件系统功能部件的运用,机器指令的选择,各种数据类型变量的存储空间分配,以及寄存器和后援寄存器的调度,等等。

目标代码的形式可以是绝对指令代码或可重定位的指令代码或汇编指令代码。如目标代码是绝对指令代码,则这种目标代码可立即执行。如果目标代码是汇编指令代码,则需汇编器汇编之后才行运行。必须指出,现在多数实用编译程序所产生的目标代码都是一种可重定位的指令代码。这种目标代码在运行前必须借助于一个连接装配程序把各个目标模块(包括系统提供的库函数)连接在一起,确定程序变量(或常数)在主存中的位置,装入内存中指定的起始地址,使之成为一个可以运行的绝对指令代码程序。

C编译过程中的五个阶段分别是预处理、词法分析、语法分析、语义分析和代码生成。这五个阶段是C编译器将源代码转换成可执行文件的过程中所必须要经过的步骤。 预处理阶段编译过程的第一步,它主要功能是进行头文件的替换和宏定义的展开等操作。预处理器会将源代码的#开头的预编译指令先进行处理,形成一个预处理后的文件。预处理之后,生成的预处理文件会被传递给下一阶段——词法分析。 词法分析阶段编译过程的第二步,它是将预处理后的文件进行分词,将代码解析成词法单元序列的过程。在这个过程中,词法分析器会根据定义的字符集和语法规则划分出代码中的各种单词,并对单词进行分类和归类,然后生成词法单元。 语法分析阶段编译过程的第三步。语法分析器会将词法单元序列转换成语法树。在这个过程中,语法分析器会根据语法规则确定词法单元之间的关系和优先级,然后构建一个语法树。这个语法树通常是一棵抽象语法树。 语义分析阶段编译过程的第四步。语义分析器会对语法树进行分析,检查程序中的语义错误和类型匹配等问题。在语义分析阶段中,需要确定函数和变量的作用域、类型检查、类型转换等问题。如果在此阶段发现了错误,编译过程就将失败。 代码生成阶段编译过程的最后一步,它将把分析过的源代码转换成目标代码或者中间代码。在这个阶段中,编译器会将抽象语法树转换成指令序列,并将指令序列按照特定的格式输出到目标文件中。输出的目标代码可以是机器码、汇编代码或者中间代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值