编译原理-LL(1)文法笔记

基本概念:

1.FLLOW集:

A∈VN
FOLLOW(A)={ a|S==*>…Aa…,a∈VT }
若S==*>…A,则#∈FOLLOW(A)
#—输入串的结束符 也可看作是句子的括号 #S#
FOLLOW(A)表示了句型中可能紧跟在A后面的终结符号

S → aA|d
A → bAS|ε

#∈Fllow(A),S->aA

a∈Fllow(A),S->aA->abAS->abAaA

d∈Fllow(A),S->aA->abAS->abAd


2.SELECT()集:

设G=(VT,VN,S,P) α∈V*
FIRST(α)={a|α==*> aβ,a∈VT}
若α==*>ε,则SELECT(A→α)= FIRST(α)

若α==*>ε,则SELECT(A→α)
            = (FIRST(α)-{ε})∪FOLLOW(A)


例:

S → aA|d
A → bAS|ε

FOLLOW(A)={a,d,#}
SELECT(A →bAS)=FIRST(bAS)={b}
SELECT(A →ε)
  =(FIRST(ε)-ε) ∪FOLLOW(A)={a,d,#}


LL(1)文法:

定义:

一个上下文无关文法是LL(1)文法的充分必要条件是,对每个非终结符的两个不同的产生式,A→α,A→β,满足:SELECT(A→α)∩SELECT(A→β)= φ


S → aA|d
A → bAS|ε


求所有SELECT集合:
SELECT(S→aA)=FIRST(aA)={a}
SELECT(S →d)=FIRST(d)={d}
SELECT(A →bAS)=FIRST(bAS)={b}
SELECT(A →ε)
  =(FIRST(ε)-ε) ∪FOLLOW(A)={a,d,#}

求每个非终结符不同产生式SELECT的交集:
SELECT(S→aA)∩SELECT(S →d)=φ
SELECT(A →bAS)∩SELECT(A →ε)=φ
所以,该文法是LL(1)文法。


LL(1)分析
含义
第一个 L 表示从左向右扫描输入符号串;
第二个 L 表示生成最左推导;
1 表示读入一个符号可确定下一步推导

对于文法G,当面临的输入符号为a,要用  非终结符A进行匹配时,假设A的所有产生  式为 A→α1| α2 |…| αn
    1)若a∈FIRST(αi ),则指派αi去执行任务
    2)若a不属于任何候选首符集,则:
      ①若ε属于某个FIRST(αi )且
      a∈FOLLOW(A),则让A与ε自动匹配
      ②否则,a的出现是一种语法错误


为避免回溯:

对于所有形如
A→αβ1|αβ2|...|αβn|γ的规则
   其中,α为左因子,γ不以α开头
改写为
A→αA'|γ  其中A’为新增加的非终结符
    A'→β1|β2|...|βn
例如
     S → xAy
     A → ab|a

提左因子后变换为
   S → xAy    
   A → aA’
   A’ → b|ε

形如:P → Pα|β
             α非ε,β不以P开始
改写为:P→βP’(P’为新增加的非终结符)
                 P'→αP'|ε
改写前产生式可产生短语
               P==>Pα==> βα
   改写后产生式可产生短语
               P==> βP’ ==> βαP' ==> βα









本程序的所用的存储结构都是string类型的,最主要的存储文法的数据结构为自定义结构,里面包括一个产生式的左部,右部以及select集合,至于非终结符的first和follow集合,则是定义了一个string类型的数组进行存储。 本程序的求first,follow,select集合的算法即为书上所介绍的方法,即求first的集合时,只看本产生式,求follow集合时,要进行递归查找一个非终结符的所有后跟字符,求select其实就是对first与follow集合的运算,最终根据所有的select集合,便可以判断此文法是否为LL(1)文法。 对于不是LL(1)文法的产生式,本程序在判断后进行转换,先进行消除左递归,然后提取左公因子,在这两步的每一步结束之后,都要对产生式进行整合,去掉空存储,去掉无法到达的产生式,将select全部置空。 每进行一次非LL(1)到LL(1)的转换之后,都要对其文法性质进行判断,如果是LL(1),则跳出,不是则继续,但是当循环一定次数之后仍不是,程序判定其无法转换,也要跳出。 其中还有对第一个非终结字符的右部替换与否进行选择,原因是,有些通过替换就可以很方便的进行转换,这个要通过人为进行输入。 提取公因子中也有上一段所说的类似的判断机制,目的是为了防止文法的左公因子无法提取完的情况出现。 最终有三种结果,一种是是LL(1)文法,一种是不是LL(1),但是经过转换变成了LL(1),还有一种是经过转换也无法变成LL(1)。 输入文本格式样例: A A->ad A->Bc B->aA B->bB
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值