编译(compilation , compile)
编译就是把高级语言变成计算机可以识别的2进制语言,计算机只认识1和0,编译程序把人们熟悉的语言换成2进制的。
编译程序把一个源程序翻译成目标程序的工作过程分为五个阶段:词法分析;语法分析;语义检查和中间代码生成;代码优化;目标代码生成。
主要是进行词法分析和语法分析,又称为源程序分析,分析过程中发现有语法错误,给出提示信息。
(1)词法分析
词法分析的任务是对由
字符组成的单词进行处理,从左至右逐个字符地对源
程序进行扫描,产生一个个的单词符号,把作为字符串的
源程序改造成为单词符号串的中间程序。执行词法分析的
程序称为词法
分析程序或扫描器。
源程序
[1]
中的单词符号经扫描器分析,一般产生二元式:单词种别;单词自身的值。单词种别通常用整数编码,如果一个种别只含一个单词符号,那么对这个单词符号,种别编码就完全代表它自身的值了。若一个种别含有许多个单词符号,那么,对于它的每个单词符号,除了给出种别编码以外,还应给出自身的值。
编辑本段(2) 语法分析
编译程序的
语法分析器以单词符号作为输入,分析单词符号串是否形成符合
语法规则的语法单位,如
表达式、赋值、循环等,最后看是否构成一个符合要求的程序,按该语言使用的语法规则分析检查每条语句是否有正确的
逻辑结构,程序是最终的一个语法单位。
编译程序的
语法规则可用
上下文无关文法来刻画。
语法分析的方法分为两种:自上而下分析法和自下而上分析法。自上而下就是从文法的开始符号出发,向下推导,推出句子。而自下而上分析法采用的是移进
归约法,基本思想是:用一个寄存符号的先进后
出栈,把输入符号一个一个地移
进栈里,当栈顶形成某个产生式的一个候选式时,即把栈顶的这一部分归约成该产生式的左邻符号。
编辑本段(3)中间代码生成
中间代码是
源程序的一种内部表示,或称
中间语言。中间代码的作用是可使
编译程序的结构在逻辑上更为简单明确,特别是可使
目标代码的优化比较容易实现中间代码,即为
中间语言程序,中间语言的复杂性介于
源程序语言和
机器语言之间。
中间语言有多种形式,常见的有逆
波兰记号、四元式、三元式和树。
编辑本段(4) 代码优化
代码优化是指对
程序进行多种等价变换,使得从变换后的程序出发,能生成更有效的
目标代码。所谓等价,是指不改变
程序的运行结果。所谓有效,主要指
目标代码运行时间较短,以及占用的
存储空间较小。这种变换称为优化。
有两类优化:一类是对
语法分析后的
中间代码进行优化,它不依赖于具体的计算机;另一类是在生成
目标代码时进行的,它在很大程度上依赖于具体的计算机。对于前一类优化,根据它所涉及的
程序范围可分为局部优化、循环优化和全局优化三个不同的级别。
编辑本段(5) 目标代码生成
目标代码生成阶段应考虑直接影响到目标代码速度的三个问题:一是如何生成较短的目标代码;二是如何充分利用计算机中的寄存器,减少目标代码访问
存储单元的次数;三是如何充分利用计算机
指令系统的特点,以提高目标代码的质量。
编辑本段(6)表格管理程序
编译过程中
源程序的各种信息被保留在种种不同的表格,编译各阶段的工作都涉及到构造、查找、或更新有关的表格。
编辑本段(7)出错处理程序
如果编译过程中发现
源程序有错误,
编译程序应报告错误的性质和错误的发生的地点,并且将错误所造成的影响限制在尽可能小的范围内,使得源程序的其余部分能继续被编译下去,有些编译程序还能自动纠正错误,这些工作由错误处理程序完成。