前一篇龙书笔记主要介绍了编译器内部实现的几个主要步骤,本篇笔记主要说明编译器前端涉及到的重要基础概念。
编译器前端主要包括词法分析、语法分析、语义分析及中间码生成4个阶段,一个典型的编译器前端处理模型如下图所示:
下面出现的术语或基础概念均是语法分析阶段会涉及到的。
1. syntax & semantics我们会在很多地方听到到“语法”和“语义”这两个概念,那么,从编译器角度来看,它们到底是指什么呢?龙书第2.1节给出了如下定义:
The syntax of a programming language describes the proper form of its programs; while the semantics of the language defines what its programs mean, that is, what each program does when it executes.
2. context-free grammar
上下文无关文法(简称文法,grammar)是一种约定的标记法(notation),用来描述由编程语言构造的层次语法结构。考虑下面的语法形式:
if(expression) statement else statement
这种语法构造规则可以被表达成下面的形式:
stmt -> if (expr)