上篇龙书笔记对编译器在程序构建中的作用做了整体的黑盒介绍,本篇笔记的目的是拆开这个盒子,对编译器内部实现流程做说明。
1. Phases of a compiler
从整体来看,编译器内部流程可以分为2大类:分析(analysis)和综合(synthesis)。
在analysis阶段,编译器将源码分解为一系列片段并为它们构建语法结构(grammatical structure),然后利用这些语法结构来创建源码的中间表示(intermediate representation)。该阶段会检查源码的语法及语义正确性,此外还会为源码建立后续会用到的符号表(symbol table)。
而synthesis阶段则是用由aynlysis阶段生成的中间表示来构造目标程序。
在专业术语上,analysis阶段被称为编译器前端(front end),而synthesis阶段被称为编译器后端(back end)。
编译器内部流程的每个阶段(phase)的任务都是把一种表示(输入)转换为另一种表示(输出),一个典型的编译器内部阶段示意图如下: