- 实验目的
- 给出 PL/0 文法规范,要求编写 PL/0 语言的语法分析程序。
- 通过设计、编制、调试一个典型的自上而下语法分析程序,实现对词法分析程序所提供的单词序列进行语法检查和结构分析,进一步掌握常用的语法分析方法。
- 选择有代表性的语法分析方法,本次实验用LR文法分析;
- 选择对各种常见程序语言都具备的语法结构,如赋值语句,特别是表达式,作为分析对象。
- 提高自己的实践能力和解决问题的能力。
- 实验原理
- 了解符已给 PL/0 语言文法,构造表达式部分的语法分析器。
分析对象〈算术表达式〉的 BNF 定义已给出。
- 将实验一“词法分析”的输出结果,作为表达式语法分析器的输入,进行语法解析,对于语法正确的表达式,输出“语法正确”;对于语法错误的表达式,输出“语法错误”,指出错误原因。
- 实验内容
1.了解符已给 PL/0 语言文法,构造表达式部分的语法分析器。
分析对象〈算术表达式〉的 BNF 定义如下:
<表达式> ::= [+|-]<项>{<加法运算符> <项>}
<项> ::= <因子>{<乘法运算符> <因子>}
<因子> ::= <标识符>|<无符号整数>| ‘(’<表达式>‘)’
<加法运算符> ::= +|-
<乘法运算符> ::= *|/
<关系运算符> ::= =|#|<|<=|>|>=
2.将实验一“词法分析”的输出结果,作为表达式语法分析器的输入,进行语法解析,对于语法正确的表达式,输出“语法正确”;对于语法错误的表达式,输出“语法错误”,指出错误原因。
3.输入:
4.输出:
- 实验算法及流程图
- 算法思想
下面主要介绍LR(0) 文法
(1)定义:文法 G 是 LR(0) 文法,当且仅当它的LR(0)FSM中的每个状态都满足:
①不同时含有移进项目和归约项目,即不存在移进-归约冲突。
②不含有两个以上归约项目,即不存在归约-归约冲突。
(2)LR(0)分析表的构造
ACTION 表项和 GOTO表项可按如下方法构造:
若项目A ->α • aβ属于 Ik 且 GO (Ik, a)= Ij, 期望字符a 为终结符,则置ACTION[k, a] =sj (j表示新状态Ij);
若项目A ->α • Aβ属于 Ik,且GO (Ik, A)= Ij,期望字符 A为非终结符,则置GOTO(k, A)=j (j表示文法中第j个产生式);
若项目A ->α •属于Ik, 那么对任何终结符a, 置ACTION[k, a]=rj;其中,假定A->α为文法G 的第j个产生式;
若项目S’ ->S • 属于Ik, 则置ACTION[k, #]为“acc”;
分析表中凡不能用上述规则填入信息的空白格均置上“出错标志”.
翻译一下:如果圆点不在项目k最后且圆点后的期待字符a为终结符,则ACTION[k, a] =sj (j表示新状态Ij);如果圆点不在项目k最后且圆点后的期待字符A为非终结符,则GOTO(k, A)=j (j表示文法中第j个产生式);如果圆点在项目k最后且k不是S’ ->S,那么对所有终结符a,ACTION[k, a]=rj (j表示文法中第j个产生式);
如果圆点在项目k最后且k是S’ ->S,则ACTION[k, #]为“acc”;
例子:
考虑文法G[S] :
S → (S) | a
相应的LR(0) FSM如下,构造其LR(0)分析表。
LR(0) FSM
从I0看,S‘->·S,期望字符是非终结符S,根据上面的规则2,得到GOTO(0,S)=1;
S‘->·(S),期望字符是终结符(,根据上面的规则1,得到ACTION(0,()=S2;
从I3看,S->a·,根据规则3,置ACTION[3, a]为r2;
从I1看,S‘->S·,根据规则4,置ACTION[1, #]为“acc”;
LR(0)分析表
- 设计思想
扩充的巴克斯范式
<表达式> ::= [+|-]<项>{<加法运算符> <项>}
<项> ::= <因子>{<乘法运算符> <因子>}
<因子> ::= <标识符>|<无符号整数>| ‘(’<表达式>‘)’
<加法运算符> ::= +|-
<乘法运算符> ::= *|/
普通的巴克斯范式
为表示方便:
表达式E、项X、因子Y、标识符b,无符号整数z,加法运算符A,乘法运算符C
E->AX|X|EAX
X->Y|XCY
Y->b|z|(E)
A->+|-
C->*|/
消除左递归
E->XE’|AXE’
E’->AXE’|ε
X->YX’
X’->CYX’|ε
Y->b|z|(E)
A->+|-
C->*|/
- LR分析算法描述
对给定的输入串,给出其分析过程及正确与否的判断
将S0移进状态栈,#移进符号栈,S为状态栈栈顶状态
begin
a=getsym() //读入第一个符号给a
while(ACTION[S,a]!=acc)
If ACTION[S,a]=si then
PUSH i,a(分别进栈);输出进栈信息
a=getsym();//读入下一个符号给a
else if ACTION[S,a] = rj (第j条产生式为A→β) then
输出归约信息
将状态栈和符号栈分别弹出|β|项; push(A);
将GOTO[S’,A]移进状态栈(S’为当前栈顶状态);
else error;
输出分析结果,接受或出错
End
- LR分析器模型
- 具体步骤
就1)移进【shift】
若ACTION[Si,a]=Sj,a为终结符,则把a移入文法符号栈,Sj移入状态栈;
(2)归约【reduce】
若ACTION[Si,a]=rj,a为终结符或#,则用第j个产生式(A->β)归约,将两个栈弹出∣β∣个元素,这时当前面临符号为第j个产生式左部的非终结符(A);若状态栈当前的栈顶状态为Sk,且GOTO[Sk,A]=j,则非终结符A移入符号栈,j移入状态栈;
(3)接受【accept】
若ACTION[Si,a]=acc,a为#,则为接受,表明分析成功;
(4)报错【error】
若ACTION[Si,a]=空白,则转向出错处理。
- 总控程序算法框架
- 算法流程图
整体算法流程图
LR算法流程图
- 实验结果与分析
- 案例验证
输入一个文法进行验证
文法为:
这个文法之前手算过,所以可以和计算机的结果进行对比,判断实验结果是否正确。
- >E+T|T
- >T*F|F
- >(E)|i
用LR文法分析
得到该文法的项目
项目集规范族
识别活前缀的DFA
消除左递归后的产生式
first集
follow集
LR分析表
修改代码,按itc 要求,提交到itc中
成功编译,但有警告信息。
根据程序运行得到的结果可以看出:编写的代码正确。
- 实验体会
1.本次实验是利用LR分析法进行语法分析,通过代码实现后更加了解了LR(K)分析方法是严格的从左向右扫描,和自底向上的语法分析方法。
2.LR分析法小结:
LR(0)构造的DFA,但是由LR(0)的DFA来构造分析表往往是不可行的,也就是说很少有语言是LR(0)的。
如果LR(0)的冲突可以根据当前输入的字符来解决,则构造的分析表为SLR分析表,SLR分析表跟LR(0)的dfa是相同的。
LR(1)构造的DFA考虑当前输入的字符,所以构造的DFA中存在的冲突比较少,也就是说它接受的语言就比较多。构造分析表时,不用额外的约束,因为它在构造dfa时就已经考虑了当前的输入字符。
考虑到LR(1)的dfa包含的状态太多,而且许多状态的不同仅仅是因为预测符的不同而已。通过合并不会产生冲突的状态,可以减少dfa的状态数,这就产生了LALR分析法。所以说LALR分析法只是对LR(1)的一种简化:通过合并同心集。
分析法的分析能力比较:LR(1)>LALR>SLR(1)>LR(0)。
3.实验心得
第四次编译原理的实验课,最大的收获是复习了hash函数的相关知识,从代码的层面深入的学习了符号表的建立与使用,同样提高了使用指针的熟练程度。
这次实验难度不大,主要是理解和掌握杂凑表(哈希表)的插入和查找等操作,以及对Symbol单链表,SymbolTable结构体的理解对编写代码尤为重要。
这是最后一次编译原理实验课,总结四次实验课的经验与教训:理解好项目给出的数据结构,以及演示模式程序执行的步骤和输出结果,熟练掌握数据结构的相关知识是完成代码的关键。
总的来说,通过四次实验课,既加深了我对编译原理课程重点内容的理解,又复习了数据结构的相关知识,提高了编写代码的能力,收获良多。
最后,特别感谢刘老师一直以来的耐心指导和同学的热心帮助!
- 附录