基于 java 编写,编译原理 LL(1)文法的简单判断
LL(1)文法的描述
1、一个上下文无关文法是LL(1)文法的充分必要条件是:对每个非终结符A的两个不同产生式,A→α, A→β,满足SELECT(A→α)∩SELECT(A→β)= Φ( 其中α,β不同时能推导出ε)。
2、LL(1)文法的含义:
第一个L即从左到右扫描输入串
第二个L即生成的是最左推导向右看一个输入符号便可决定选择哪个产生式。
3、LL(1)文法的判别:当我们需选用自顶向下分析技术时,首先必须判别所给文法是否是LL(1)文法。因而我们对任给文法需计算FIRST、FOLLOW、SELECT集,进而判别文法是否为LL(1)文法。
FIRST集
1、定义:
设G=(VT,VN,S,P)是上下文无关文法 ,FIRST(α)={a|α→aβ,a∈VT,α,β∈V*}
特别的,若α→ε,则规定ε∈FIRST(α).
2、根据定义求解FIRST集(对每一文法符号X∈VN 计算FIRST(X)):
(1). 若X∈VT,则FIRST(X)={X}。
(2). 若X∈VN,且有产生式X→a…,a∈VT, 则 a∈FIRST(X)X→ε,则ε∈FIRST(X)。
(3). X→Y…是一个产生式且Y ∈VN 则把FIRST(Y)中的所有非空符号串ε元素都加入到FIRST(X)中。
(4).若X∈VN;Y1,Y2,…,Yi∈VN,且有产生式X→Y1 Y2 … Yn;当Y1 Y2 … Yn-1→ε时,则FIRST(Y1)、FIRST(Y2)、…、FIRST(Yn-1)的所有非空元素和FIRST(Yn) 包含在FIRST(X)中。
(5).当(4)中所有Yi→ε,(i=1,2,…n),则
FIRST(X)=(FIRST(Y1)-{ε})∪(FIRST(Y2)- {ε}∪…∪(FIRST(Yn) -{ε})∪{ε}
反复使用上述(2)~(5)步直到每个符号的FIRST集合不再增大为止。
FOLLOW集
1、定义:
设G=(VT,VN,S,P)是上下文无关文法,A∈VN,S是开始符号
需要注意的是,FOLLOW(A)集是针对非终结符A的,集合中的元素是终结符,是A的全部后跟符号的集合,当A是文法G的开始符(识别符)时,把‘#也加入其中’
2、根据定义求解FOLLOW集(对每一文法符号S∈VN 计算FOLLOW(S)):
(1). 设S为文法中开始符号,把{#}加入FOLLOW(S)中(这里“#”为句子括号)。
(2). 若A→αBβ是一个产生式,则把FIRST(β)的非空元素加入FOLLOW(B)中。如果β→ε则把FOLLOW(A)也加入FOLLOW(B)中。
(3).反复使用(b)直到每个非终结符的FOLLOW集不再增大为止。
SELECT集
1、定义:
给定上下文无关文法的产生式A→α, A∈VN,α∈V*:
若α不能推导出ε,则SELECT(A→α)=FIRST(α)
如果α能推导出ε则:SELECT(A→α)=(FIRST(α) –{ε})∪FOLLOW(A)
需要注意的是,SELECT集是针对产生式而言的。
概要设计
首先运行源程序,在界面相应文本区依次输入文法G[S]的产生式,显示到文本区域t1 (JTextArea类型) 中,对产生式无顺序要求,但不允许输入非法的产生式,例如空。输入完成后,进入文法分析阶段。
文法分析程序的功能是对文本区t1的所有字符串从头到尾逐一扫描,然后将读到的字符串(如S→AB)拆分成每个字符进行分析,“→”左侧为产生式的左部(非终结符Vn),右侧为产生式的右部,一般的产生式为二型文法,即左侧只允许输入一个大写字母,右侧输入的字符串中的非大写字母(小写字母a~z,各种符号)为终结符Vt。
LL(1)文法分析的过程如下:
(1) 计算FIRST集。
(2) 计算FOLLOW集。
(3) 计算SELECT集。
(4) 判定是否为LL(1)文法。
在求解FIRST集时定义了如下数据结构:
String Vn[] = null; //所有非终结符集合
int Vnnum; //非终结符个数
int firstComplete[] = null; // 存储已判断过 first 的数据
char first[][] = null; // 存储最后 first 结果
first = new char[Vnnum][100];
String s[] = t1.getText().split("\n"); //依次读取文本框中的每条产生式
char yn_null[] = null; // 存储能否推出空
String firstVn[] = null; // 进行first判断的Vn集合
在求解FOLLOW集时定义了如下数据结构: