概念罗列:
语言处理程序
- 编译器 将源代码翻译成目标程序
- 解释器 根据源代码来执行相应的操作
编译器的结构
- 前端:分析部分,将源代码进行拆分,并添加语法结构,生成中间表示和符号表。并将中间表示和符号表传递给后端。
- 后端:根据前端输入构建目标程序。
编译过程的步骤:
- 词法分析: 将源代码字符流组织成词素的序列,并以词法单元的形式输出。
- 词法单元(token): 通常形式:<抽象符号, 属性>, 抽象符号给语法分析步骤使用,属性给语义分析和代码生成步骤使用。
- 语法分析: 根据token的抽象符号来生成一个中间表示,通常为语法树。
- 语义分析: 使用语法树和符号表中的信息对源代码做语义检查,同时收集类型信息,并把这些信息放在语法树或符号表中,提供给中间代码生成过程使用。
- 中间代码生成: 根据语法树和符号表生成一个更加具体的中间表示,通常为类机器语言。包含两个重要性质:易于生成,且易于翻译为目标机器上的语言。在编译原理一书中,使用三地址代码作为中间表示形式。
- 代码优化: 改进生成的中间代码,以便生成更好的目标代码。
- 代码生成: 将源程序的中间表示作为输入,生成目标语言,如果目标是机器代码,则必须为程序使用的每个变量选择寄存器或内存位置。
- 符号表管理: 记录源程序中使用的变量的名字,并收集对应的各种属性信息,包括存储分配、类型、作用域。对于过程名字,信息还包括:参数数量和类型,参数传递方法,返回类型。
- 将多个步骤组合成趟: 将前面所述的各个步骤组合成。