编译原理之LL(1)文法

一 . 什么是不确定的自顶向下的语法分析

a. 算法思想

对于任一输入符号串,试用一切可能的办法从树根结点出发根据文法自上向下的为输入串建立一棵语法树。

b. 存在的问题

  • 左递归问题
  • 回溯问题
  • 虚假现象
  • 出错位置不确定

二. 什么是确定的自顶向下语法分析,对文法的要求是什么?

对于任一输入符号串,从文法的识别符号出发,根据当前的输入符号,唯一的确定一个产生式,用产生式的右部的符号串替代相应的非终结符往下推导,或构造一棵语法树。若能推导出输入串或构造语法树成功则输入串是句子,否则不是。

b. 举例

文法G[S]:
S->pA |qB
A->cAd|a
输入串w=pccadd
文法特点:
  1. 每个产生式的右部都由终结符号开始;
  2. 两个产生式若左部相同,则其右部以不同的终结符号开始;
  3. 无空产生式U->e

语法树:
在这里插入图片描述
对应的最左推导:(根据产生式的右部的首符号选择产生式)
在这里插入图片描述

三 . 什么是FIRST 集,FOLLOW集?

1.构造文法符号X的FIRST集:

(1)X∈VT,则FIRST(X)={X};
(2)X∈VN,且有X->a…, 则a 加入FIRST(X);
                  若有X->ε,则ε加入FIRST(X);
(3)若有X->Y…,且Y∈VN ,则FIRST(Y)中非ε元素
      全部加入FIRST(X);

若有X->Y1Y2Y3…YK,且Yi∈VN ,ε∈FIRST(Yj)

                则FIRST(Yi)中非ε元素加入FIRST(X);

 若ε∈FIRST(Xj),1≤j≤k,则ε加入FIRST(X)

2.构造符号串α的FIRST集: (α=X1X2…XN)

(1)首先FIRST(α)= FIRST(X1){ε};
(2) 若ε∈FIRST(Xj),则FIRST(Xi){ε}加入FIRST(α);
(3) 若ε∈FIRST(Xj),则ε加入FIRST(α);
例:设有文法G[E]:

E→TE’ E’→+TE’|ε T→FT’ T’→*FT’|ε F→(E)|i

求非终结符号的First集:
First(E)={(,i}
First(E’)={+,ε}
First(T)={(,i}
First(T’)={,ε}
First(F)={(,i} First(E’T’)={+,
,ε}

3.构造非终结符X的FOLLOW集

(1)对文法开始符号S, #加入FOLLOW(S);

(2)若有A->αBβ,则FIRST(β){ε}加入FOLLOW(B);

(3)若有A->αB, 或A->αBβ且ε∈ FIRST(β),则 FOLLOW(A)加入FOLLOW(B);

求Follow集的步骤:

1.对文法开始符号s,置$于FOLLOW(S)中;
2. 对于产生式: A->aBC,将除去空集e的First ©加入Follow (B)中;
3.对于产生式: A->aB或者A->aBC (其中c可以推导出空串,C=>*e),则将Follow (A)加入Follow (B)

4. 什么是LL(1) 文法?应满足什么要求?

如果一个文法满足以下条件:

1、文法不含左递归。

2、对文法中每一个非终结符A的各个产生式的候选首

符集两两不相交。

3、对文法中每一个非终结符A,若存在某个候选首

符集包含e,则

        First(A)^ Follow(A)=F(空)

  LL(1)中第一个L表明自左(Left)向右扫描输入串,第二个

L表明分析过程采用最左(Left)推导,括号中的1表明只需向右

看一个符号便可决定选择哪个产生式进行推导。

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本程序的所用的存储结构都是string类型的,最主要的存储文法的数据结构为自定义结构,里面包括一个产生式的左部,右部以及select集合,至于非终结符的first和follow集合,则是定义了一个string类型的数组进行存储。 本程序的求first,follow,select集合的算法即为书上所介绍的方法,即求first的集合时,只看本产生式,求follow集合时,要进行递归查找一个非终结符的所有后跟字符,求select其实就是对first与follow集合的运算,最终根据所有的select集合,便可以判断此文法是否为LL(1)文法。 对于不是LL(1)文法的产生式,本程序在判断后进行转换,先进行消除左递归,然后提取左公因子,在这两步的每一步结束之后,都要对产生式进行整合,去掉空存储,去掉无法到达的产生式,将select全部置空。 每进行一次非LL(1)到LL(1)的转换之后,都要对其文法性质进行判断,如果是LL(1),则跳出,不是则继续,但是当循环一定次数之后仍不是,程序判定其无法转换,也要跳出。 其中还有对第一个非终结字符的右部替换与否进行选择,原因是,有些通过替换就可以很方便的进行转换,这个要通过人为进行输入。 提取公因子中也有上一段所说的类似的判断机制,目的是为了防止文法的左公因子无法提取完的情况出现。 最终有三种结果,一种是是LL(1)文法,一种是不是LL(1),但是经过转换变成了LL(1),还有一种是经过转换也无法变成LL(1)。 输入文本格式样例: A A->ad A->Bc B->aA B->bB

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值