编译原理——LL(1)文法的判定

本文详细介绍了LL(1)文法的判定过程,包括计算First集、Follow集、Select集,并通过Python实现相关算法。文章强调理解非终结符First集和Follow集的含义,以及LL(1)文法避免产生式冲突的重要性。
摘要由CSDN通过智能技术生成

大概步骤

LL(1)文法的判定

准备工作

数据结构:本次实验选用python语言进行编程,主要用到的数据结构为字典。因其键值对一一对应较为方便,适合模拟LL(1)文法产生式左部和右部的对应关系。对于同一个非终结符多次出现在产生式左部的情况,本次实验采取的策略是用列表作为该键的值,这样便可以实现“一对多”的关系。
在这里插入图片描述

任务一 计算First

求解每个符号的First集:遍历所有符号,当该符号为终结符时,其First集仅有它自己这一个元素。否则如果是非终结符,先判断其是否能推出ε,如果能则将ε加入该符号的First集。接着,对以该终结符为左部的产生式的右部串进行扫描,判断该串的第一个符号,如果符号为终结符,则将此终结符加入First集。至此,我们可以得到所有能推出ε和直接推出终结符的First集。
在这里插入图片描述

接下来处理不能直接推出的情况。对每个非终结符,遍历对应产生式右部的每个符号,将每个符号的First集并入此非终结符的First集直到遇到第一个不能推出空串ε的非终结符为止。这里对空串ε的处理方法是:开始遍历每个非终结符时,设置一个标记all_null,并初始化为1,仅当遇到第一个不能推出空串ε的非终结符时,将all_null置为0,并不再判断该串后面的符号。值得注意的是,每次合并First集合时,并不把空串合并进去,当一个右部串判断结束后再判断all_null的值,如果all_null为1,则把空串ε加入First集。后面将多次用到all_null标记,思想较为相似,不再赘述。
在这里插入图片描述

这里还有一个问题,在进行取并集时,由于数据结构用的是列表,会有重复元素,因此要进行消重。这在后面也多次用到。
在这里插入图片描述

任务二 计算每个产生式右部的First集

求解每个产生式右部的First集:这里求解思路和求每个符号的First差不多,主要需要注意的地方当遇到第一个不能推出空串得非终结符时,停止后续符号的判断。这里也用到all_null进行控制,并且同样需要消重。
在这里插入图片描述

任务二 计算Follow

6. 求解每个非终结符的Follow集:第一步,需要把“#”放入开始符号“S”的Follow集中。接下来主要思想是找到每一非终结符所在串的下一个符号的First集,这里有几种特殊情况:(1)终结符为位于串尾,此时要将左部的Follow集并入该终结符的Follow集;(2)下一个符号推出空串ε,此时需要把下一个的后一个非终结符的Follow并入。注意:Follow集中不能出现空串ε。在代码实现上,可以把该非终结符后面所有的非终结符的Follow都并入Follow中,直到遇到串中的一个非终结符不能推出空串ε。这种合并…直到…的思想前面已经多次用到,可以是代码更简洁。最后再把所有的空串ε移除Follow集。消重不再赘述。
在这里插入图片描述

任务三 计算Select

求解每个产生式的Select集:求解出所有的First集和Follow后,可以直接利用公式得到Select。
在这里插入图片描述

任务四 判断

判断是否为LL(1)文法:最后一步进行判断,设置标记LL_1初始化为1,当交集不为空时LL_1置为0,得到最终判断结果。

总之,本次实验编码过程并不难,只需要注意一些细节和技巧,更为重要的是理解LL(1)文法判定的每一步思想,要真正地理解非终结符的First集和Follow集的意义是当词法分析遇到该非终结符时,下一步能够推得的终结符是哪些,进一步理解寻找Select交集的原因是遇到同一个终结符时,选择产生式会不会有多个产生式可选的冲突。如果要进一步探索本实验,可以增加第一步判断空串ε,还可以实现输入任意的上下文无关文法,判断其是否为LL(1)文法。

源代码

// An highlighted block
G = {
   'S': ['AB', 'bC'], 'A': ['ε', 'b'], 'B': ['ε', 'aD'], 'C': ['AD', 'b'], 'D': ['aS', 'c']}   # G[S]
non_terminal = ['S', 'A', 'B', 'C', 'D']  # non_terminal
terminal = ['a', 'b', 'c']    # terminal
null = 'ε'  # null string
First = {
   }
right_First = {
   }
print("G[S]:")
for left in G:
    for i in range(len(G[left])):
        print(left, '->', G[left][i])

# ============================== First Sets ========================================
for char in non_t
  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本程序的所用的存储结构都是string类型的,最主要的存储文法的数据结构为自定义结构,里面包括一个产生式的左部,右部以及select集合,至于非终结符的first和follow集合,则是定义了一个string类型的数组进行存储。 本程序的求first,follow,select集合的算法即为书上所介绍的方法,即求first的集合时,只看本产生式,求follow集合时,要进行递归查找一个非终结符的所有后跟字符,求select其实就是对first与follow集合的运算,最终根据所有的select集合,便可以判断文法是否为LL(1)文法。 对于不是LL(1)文法的产生式,本程序在判断后进行转换,先进行消除左递归,然后提取左公因子,在这两步的每一步结束之后,都要对产生式进行整合,去掉空存储,去掉无法到达的产生式,将select全部置空。 每进行一次非LL(1)到LL(1)的转换之后,都要对其文法性质进行判断,如果是LL(1),则跳出,不是则继续,但是当循环一定次数之后仍不是,程序判定其无法转换,也要跳出。 其中还有对第一个非终结字符的右部替换与否进行选择,原因是,有些通过替换就可以很方便的进行转换,这个要通过人为进行输入。 提取公因子中也有上一段所说的类似的判断机制,目的是为了防止文法的左公因子无法提取完的情况出现。 最终有三种结果,一种是是LL(1)文法,一种是不是LL(1),但是经过转换变成了LL(1),还有一种是经过转换也无法变成LL(1)。 输入文本格式样例: A A->ad A->Bc B->aA B->bB
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值