编译原理LR(0)项目集规范族的构造和分析的构造

最新推荐文章于 2025-04-20 09:18:56 发布

雪山上的小草

最新推荐文章于 2025-04-20 09:18:56 发布

阅读量3.9w

点赞数 197

分类专栏：编译原理

编译原理专栏收录该内容

3 篇文章

订阅专栏

本文通过实例讲解了LR(0)分析方法的基本原理，包括项目集规范族的构造、分析表的生成及输入串分析过程。并提供了一个判断文法是否为LR(0)的具体案例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学编译原理的时候，感觉什么LL(1)、LR(0)、SLR(1)、LALR(1)思想满天飞。

而且做题的时候，一不留意，一道题就写了三页纸了。

就拿今天这个玩意儿来讲，我真的是考试前花了最多的时间，搞懂了（差不多搞懂了）这是个什么玩意儿。

以下内容，做题的话应该够了而且很！容！易！理！解！，其他学术情况恕博主也是个菜鸡。

废话就不多扯了，能搜到看到这篇文章的小伙伴也不容易，挺有缘的，根据步骤想参考资料的话，就拿出你的《编译原理第二版·清华大学出版社》吧，第二版哦！我也不知道第三版一不一样，反正页数好像是不一样。

我这里就用书上现成的例子了吧，第二版的7.2.4 LR(0)项目集规范族的构造这节本身其实写得很详细很学术很看不懂。大概跟本文有关而且有意思很重要的内容是这样的：

现在得到了一个拓广文法G'（前面有介绍怎么求，很简单就加个S'的规则就行），好这势必是一个好的开头。

S'->E

E->aA | bB

A->cA | d

B->cB | d

接下来求文法的项目，这个也简单，就给每个规则加一个点以后然后挪位置，挪一个位置就得到一个项目，操作完了以后你就得到了一堆项目，这就是你接下来要面对的核心的东西了。

1.S'->·E 2.S'->E· 3.E->·aA 4.E->a·A 5.E->aA· 6.A->·cA 7.A->c·A 8.A->cA· 9.A->·d

10.A->d· 11.E->·bB 12.E->b·B 13.E->bB· 14.B->·cB 15.B->c·B 16.B->cB· 17.B->·d 18.B->d·

有关CLOSURE闭包的构造和转向函数GOTO(I,X)的定义小伙伴们自己看书吧，说实话你要真让我复述定义我也半吊子，但内涵理解了就做题没毛病了。不过还是要提到一个“核”的概念，你可以理解为那张图的每一个状态最头上那条规则。

接下来构造项目集规范族那张图的步骤是这样的：

把有S'的项目而且点在最左边的项目作为状态I0的核，放在开头。然后看这个点后面的非终结符，是个E，接下来就去项目中找左部是E的而且点在最左边开头位置的项目，列在核的下面，这就是状态I0了，你可以画个框框然后标记一下。

接下来还是先看核里面点后的这个非终结符E，输入E（你可以理解为在箭弧上标了个E），把点向后移一位，得到S'->E·，这其实是得到了一个新的状态的核。当然另外两个也一样，输入点后面的符号，比如输入a得到E->a·A为核的新状态，输入b得到E->b·B为核的新状态。得到新状态的核了，就顺便把这个状态剩下的项目也列出来吧，就是看核的点后面的非终结符，找以这个非终结符为左部的点在最左边的项目。当然要是点后面没有东西就不用找了，新的状态记得标号哦。

其实，讲到这里项目集规范族的构造方法部分就！完！了！接下来就是重复上面的工作，从每一个新状态出发，逐个输入每个项目点后面的符号，就是后移一位，又分别作为新的状态的核然后根据核找下面的同状态里的项目。找到找不动为止。比如我再找一个I2后面的试试：

当你求出整张图的时候，恭喜你万里长征走完第一步了，后面可能涉及到的LR(0)分析表的构造，本文就“请看下回分解”了。

分析表的构造

上回把文法的LR(0)项目集规范族搞了半天，革命进行了一半。

鼓捣了半天整了一堆项目集规范族出来，总是有用的呀，接下来就是在那堆的基础上构造分析表了，构造好分析表就能分析输入串了。本文主要讲LR(0)分析表的构造和输入串分析过程。

我这个菜鸡都觉得是通！俗！易！懂！的！！

憋说话往下看->

多的不扯，博(cai)主(ji)我使用的是清华大学出版社的《编译原理第二版》，第二版哦，不知道第三版的小伙伴内容是不是一样的，页数好像不一样我记得。在LR分析这一章的第二节后面，就是有项目集规范族那张图那儿，我们还是以那个文法为主题讲。

为了方便我直接为大家列好啦~

OK，这是上回我们构造好的项目集规范族，在构造分析表之前我们先画好分析表。

先写好ACTION和GOTO两个列标题，然后在ACTION下面写一排文法的所有的终结符，别忘了还有#，GOTO下面写文法中除了S'以外的所有的非终结符。

OK，接下来是这样的，书上也有详细的关于分析表构造算法的解释，说白了，其意思应该是这样的：

1、找项目集规范族有S'->A·这种形状的那个状态Ik，就是第k个状态，则把分析表第k行的#列标上acc

2、按顺序（我一般是按状态序号顺序）分析状态的项目和GOTO函数，主要就是看每个项目的点后面的符号。

（1）要是是个终结符，看输入这个终结符后去的哪个状态，比如当前是状态I0，对于第二个项目E->·aA，输入a以后去了状态I2，那就在分析表中第0行的a列写上S2，意思就是状态Ik输入Vt后去了Ij状态。

（2）要是是个非终结符，这个更好理解，比如从状态Ik输入这个非终结符以后去了状态Ij，那就在GOTO表的第k行第Vn列写j。

3、你会发现有的项目的点是在最后，这就是分析表里面那些小r的来历了。先看这个项目所在的状态，再看点前面的规则是文法里面的第几个规则，比如说状态I10的A->d·里面的A->d就是文法的第4条规则，那就在分析表的第10行所有的终结符列包括#列写上r4，就是ACTION列的一行写满。即状态Ik的项目来自于文法的第j条规则，则分析表的第k行都是rj。

我们具体试试吧：

1、先找acc，以免高兴过头了忘记。状态I1里面有S'->E·，所以acc在第1行。