编译原理学习笔记——第六讲 语法分析:自顶向下分析(递归下降分析程序)
1. 构造递归下降分析器
定义全局过程和变量 ADVANCE,把输入串指示器IP指向下一个输入符号,即读入一个单词符号 SYM,IP当前所指的输入符号 ERROR,出错处理子程序 A→TE′ | BC |ε 对应的递归下降子程序为:
PROCEDURE A;
BEGIN
IF SYM ∈ FIRST(TE’) THEN
BEGIN T;E′ END
ELSE IF SYM ∈ FIRST(BC) THEN
BEGIN B; C END
ELSE IF SYM ∉ FOLLOW(A) THEN
ERROR
END;
文法G(E): E→TE′ E′→+TE′ |ε T→FT′ T′→*FT′ |ε F→(E) | i
PROCEDURE F;
IF SYM=‘i’ THEN
ADVANCE
ELSE
IF SYM=‘(’ THEN
BEGIN
ADVANCE;
E;
IF SYM=‘)’ THEN
ADVANCE
ELSE ERROR
END
ELSE ERROR;
PROCEDURE E;
BEGIN
T;E′
END;
PROCEDURE E′;
IF SYM=‘+’ THEN
BEGIN
ADVANCE;
T;E′
END
PROCEDURE T;
BEGIN
F;T′
END
PROCEDURE T′;
IF SYM=‘*’ THEN
BEGIN
ADVANCE;
F;T′
END;
主程序:
PROGRAM PARSER;
BEGIN
ADVANCE;
E;
IF SYM <>’#’ THEN
ERROR
END;
2. 扩充的巴科斯范式和语法图
在元符号“→”或“::=”和“|”的基础上,扩充几个元语言符号: 用花括号{α}表示闭包运算α*。 用表示{α}0 n 可任意重复0次至n次。 用方括号[α]表示{α}0 1 ,即表示α的出现可有可无(等价于α|ε)。 例如,通常的“实数”可定义为: Decimal→[Sign]Integer.{digit}[Exponent] Exponent→E[Sign]Integer Integer→digit{digit} Sign→ + | - 文法G(E): E→T | E+T T→F | T*F F→i | (E) 可表示成 E→T{+T} T→F{*F} F→i | (E) 语法图: 设计递归下降分析程序
PROCEDURE E;
BEGIN
T;
WHILE SYM=‘+’ DO
BEGIN
ADVANCE;
T
END
END;
PROCEDURE T;
BEGIN
F;
WHILE SYM=‘*’ DO
BEGIN
ADVANCE;
F
END
END;
PROCEDURE F;
IF SYM=‘i’ THEN
ADVANCE
ELSE
IF SYM=‘(’ THEN
BEGIN
ADVANCE;
E;
IF SYM=‘)’ THEN
ADVANCE
ELSE ERROR
END
ELSE ERROR;
3. JavaCC简介
Java Compiler Compiler (JavaCC) - The Java Parser Generator 官网:http://javacc.java.net/ 可以自动生成一个自顶向下的递归下降的语法分析程序
<parser_name>.java
<parser_name>Constants.java
<parser_name>TokenManager.java
ParseException.java
SimpleCharStream.java
Token.java
TokenMgrError.java