前排提示——本文只提供思路,不提供代码甚至代码
代码运行效果放在文末,可直接翻到最后进行查看
求 emptyOK和emptyNO
对非终结符号VN分为了两类:最终可以推出空串(emptyOK) + 最终也无法推导出空串的(emptyNO)(这尤为关键,是整个自上而下分析的基础,一步错步步错)
Set<Character> emptyOK = new HashSet<>(); // 最终可以推导出空串
Set<Character> emptyNO = new HashSet<>(); // 最终不可推导出空串
第一次扫描
对于某个终结符A,如果生成式右侧为ε,即直接可以推导出空串,将该生成式左侧加入emptyOK集合
第二次扫描
对于某个终结符A,如果以此为左侧的生成式,右侧全都包括至少一个终结符a,则将其加入emptyNO集合
循环扫描(1次扫描尝试加入emptyOK + 1次扫描尝试加入emptyNO)
while(true) {
//当这两个集合都不再变化时,STOP
1.循环中的第一次扫描,当右侧全为非终结符(ABC)并且它们都在emptyOK之中时,将生成式左侧加入emptyOK集合
2.循环中的第二次扫描,对于某个非终结符A,以其为左侧的所有生成式的右侧,都至少包括一个终结符b 或 一个在emptyNO中的非终结符B,则将A加入emptyNO集合
}
求 FirstV集
即求非终结符VN和终结符VT的firstV集,为之后求推导式右侧字符串的first集作准备
// 对于终结符VT,其firstV就是自身(e.g. FirstV(a) = {a})
// 而对于非终结符VN,求其firstV需要扫描(下面就是)
while(true) {
// 不断尝试更新firstV,当其不再变化时停止循环
for(生成式 : 文法) {
index扫描生成式就可以了,直到扫描到终结符
如果这个index能够移动到串的最后(str.length()),就可以把ε加到该VN的firstV中
}
}
求 First集
// 我们已经求出每个文法符号(VN+VT)的firstVN了,在求字符串的first的时候是完全不需要while循环的
for(生成式 : 文法) {
index扫描,不断加入所指符号的FirstV集,直到不可推出空串的符号为止
}
求 Follow集
// 以「S -> ABCD」为例
用一个index扫描生成式右侧字符串,当index指向一个非终结符VN时,开启以下算法(假设当前指向B):
1. 将其后方的firstV加到当前的follow当中;如果后方可推出ε,则用一个jndex继续向后扫直到扫到不可推出ε的字符为止
2. 如果这个时候jndex == str.length(),说明这一路(包括结束)都可以推出ε,因此这时把左侧的VN的follow加到当前的follow当中
// 另外两点,要有这种意识:
1. 第一步啥都别干,赶紧直接把把{#}加到开始符号S的follow里
2. 随符集follow中是不可能出现ε的,因此每次向follow加first时,都要把ε去掉,即加入"非空串元素"
3. while循环结束的条件依旧是follow集不再变化
求 Select集
// 这可能是整个文法分析中最简单的一步
// 以「S->ABC」为例:
if(first(ABC)中含有ε) {
Select(S->ABC) = First(ABC) - {ε} + Follow(S)
} else {
Select(S->ABC) = First(ABC)
}
判断是否为LL(1)文法
return 具有相同左部的Select集没有交集
Java代码运行效果