编译原理Java实现——First集、Follow集、Select集、判断是否为LL(1)文法

前排提示——本文只提供思路,不提供代码甚至代码

具体的可运行代码移步这里进行下载:(花钱的)CSDN ,(不花钱)Github

代码运行效果放在文末,可直接翻到最后进行查看

 
 

求 emptyOK和emptyNO

对非终结符号VN分为了两类:最终可以推出空串(emptyOK) + 最终也无法推导出空串的(emptyNO)(这尤为关键,是整个自上而下分析的基础,一步错步步错)

Set<Character> emptyOK = new HashSet<>();                       // 最终可以推导出空串
Set<Character> emptyNO = new HashSet<>();                       // 最终不可推导出空串

第一次扫描
对于某个终结符A,如果生成式右侧为ε,即直接可以推导出空串,将该生成式左侧加入emptyOK集合

第二次扫描
对于某个终结符A,如果以此为左侧的生成式,右侧全都包括至少一个终结符a,则将其加入emptyNO集合

循环扫描(1次扫描尝试加入emptyOK + 1次扫描尝试加入emptyNO)
while(true) {
	//当这两个集合都不再变化时,STOP
	1.循环中的第一次扫描,当右侧全为非终结符(ABC)并且它们都在emptyOK之中时,将生成式左侧加入emptyOK集合
	2.循环中的第二次扫描,对于某个非终结符A,以其为左侧的所有生成式的右侧,都至少包括一个终结符b 或 一个在emptyNO中的非终结符B,则将A加入emptyNO集合
}

 

求 FirstV集

即求非终结符VN终结符VT的firstV集,为之后求推导式右侧字符串的first集作准备

// 对于终结符VT,其firstV就是自身(e.g. FirstV(a) = {a})
// 而对于非终结符VN,求其firstV需要扫描(下面就是)

while(true) {
	 // 不断尝试更新firstV,当其不再变化时停止循环
	 for(生成式 : 文法) {
	 	index扫描生成式就可以了,直到扫描到终结符
	 	如果这个index能够移动到串的最后(str.length()),就可以把ε加到该VN的firstV中
	 }
}

 

求 First集

// 我们已经求出每个文法符号(VN+VT)的firstVN了,在求字符串的first的时候是完全不需要while循环的
for(生成式 : 文法) {
	index扫描,不断加入所指符号的FirstV集,直到不可推出空串的符号为止
}

 

求 Follow集

// 以「S -> ABCD」为例
用一个index扫描生成式右侧字符串,当index指向一个非终结符VN时,开启以下算法(假设当前指向B)1. 将其后方的firstV加到当前的follow当中;如果后方可推出ε,则用一个jndex继续向后扫直到扫到不可推出ε的字符为止
     2. 如果这个时候jndex == str.length(),说明这一路(包括结束)都可以推出ε,因此这时把左侧的VN的follow加到当前的follow当中
     
// 另外两点,要有这种意识:
     1. 第一步啥都别干,赶紧直接把把{#}加到开始符号S的follow里
     2. 随符集follow中是不可能出现ε的,因此每次向follow加first时,都要把ε去掉,即加入"非空串元素"
     3. while循环结束的条件依旧是follow集不再变化

 

求 Select集

// 这可能是整个文法分析中最简单的一步
// 以「S->ABC」为例:
if(first(ABC)中含有ε) {
	  Select(S->ABC) = First(ABC) - {ε} + Follow(S)
} else {
	  Select(S->ABC) = First(ABC)
}

 

判断是否为LL(1)文法

return 具有相同左部的Select集没有交集

 
 
 

Java代码运行效果

在这里插入图片描述
在这里插入图片描述

 
 
 
 
 
 

  • 4
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
本程序的所用的存储结构都是string类型的,最主要的存储文法的数据结构为自定义结构,里面包括一个产生式的左部,右部以及select合,至于非终结符的first和follow合,则是定义了一个string类型的数组进行存储。 本程序的first,followselect合的算法即为书上所介绍的方法,即first的合时,只看本产生式,follow合时,要进行递归查找一个非终结符的所有后跟字符,select其实就是对first与follow合的运算,最终根据所有的select合,便可以判断此文法是否为LL(1)文法。 对于不是LL(1)文法的产生式,本程序在判断后进行转换,先进行消除左递归,然后提取左公因子,在这两步的每一步结束之后,都要对产生式进行整合,去掉空存储,去掉无法到达的产生式,将select全部置空。 每进行一次非LL(1)到LL(1)的转换之后,都要对其文法性质进行判断,如果是LL(1),则跳出,不是则继续,但是当循环一定次数之后仍不是,程序判定其无法转换,也要跳出。 其中还有对第一个非终结字符的右部替换与否进行选择,原因是,有些通过替换就可以很方便的进行转换,这个要通过人为进行输入。 提取公因子中也有上一段所说的类似的判断机制,目的是为了防止文法的左公因子无法提取完的情况出现。 最终有三种结果,一种是是LL(1)文法,一种是不是LL(1),但是经过转换变成了LL(1),还有一种是经过转换也无法变成LL(1)。 输入文本格式样例: A A->ad A->Bc B->aA B->bB

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值