自下而上的语法分析

最新推荐文章于 2023-01-20 15:55:17 发布

_Liz

最新推荐文章于 2023-01-20 15:55:17 发布

阅读量1k

点赞数

分类专栏：编译原理文章标签：编译原理自下而上语法分析 LR分析表

本文链接：https://blog.csdn.net/weixin_36191602/article/details/84678905

版权

编译原理专栏收录该内容

6 篇文章 0 订阅

订阅专栏

句柄

右句型 $\gamma$ 的句柄是一个产生式的右部 $\beta$ ，并且该句柄 $\beta$ 通过产生式 $A\rightarrow\beta$ 归约后，得到的是最右推导中的前一个句型。
右句型：所有在最右推导中出现的句型都是右句型。
? $\Rightarrow _ { r m }$ aABe $\Rightarrow _ { r m }$ aAde $\Rightarrow _ { r m }$ aAbcde $\Rightarrow _ { r m }$ abbcde
文法为
$\rightarrow$ aABe
$\rightarrow A b c | b }$
$\rightarrow d$
abbcde中的第一个b通过 $A\rightarrow b$ 归约后得到aAbcde，是最右推导的前一个句型，所以第一个b是句柄。而第二个b通过 $A\rightarrow b$ 归约后得到aAAcde，不是最右推导的前一个句型，所以第二个b不是句柄。（栗子中加粗部分为句柄）

句柄的右边仅含终结符。
如果文法二义，那么句柄可能不唯一。

两个冲突

移进-归约冲突：既可以移进又可以归约时，无法决定。
归约-归约冲突：当不止一个产生式可以归约，无法决定对哪个产生式进行归约。

活前缀

活前缀：右句型的前缀，该前缀不超过最右句型句柄的右端。
在移进-归约分析中，出现在栈中的串都是活前缀。
? $\mathcal { S } \Rightarrow * _ { r m } \gamma A w \Rightarrow _ { r m } \gamma \beta w$
$\gamma \beta$ 的任意前缀（包括 $\varepsilon$ 和 $\gamma \beta$ 本身）都是活前缀，这里的 $\beta$ 是句柄。

LR分析表

L表示从左到右扫描输入串，R表示最右推导。分为LR(0)/SLR(1)、LR(1)、LALR三种。

构造SLR分析表

拓广文法，即添加产生式 $\prime } \rightarrow S$
构建识别活前缀的DFA
根据DFA构建SLR分析表

构建识别活前缀的DFA

LR(0)闭包函数closure(I)

I中的所有项都属于closure(I)
如果 $\rightarrow \alpha \cdot B \beta$ 属于closure(I)，并且 $\rightarrow \gamma$ 是产生式，那么如果 $\rightarrow \cdot \gamma$ 还不在closure(I)中，则把它加入closure(I)中。
重复上面两个步骤，直至closure(I)不再变化。

LR(0)状态转换函数goto(I, X)
I状态集中所有形如 $\rightarrow \alpha \cdot X \beta ]$ 的产生式对应的产生式 $\rightarrow \alpha X \cdot \beta ]$ 的LR(0)闭包。X为终结符或非终结符。
? $\rightarrow$ aABe ； $\rightarrow A b c | b }$ ； $\rightarrow d$
对于 $I_0: S' \rightarrow S$ ； $\rightarrow \cdot aABe$
$I_1=goto(I_0, a):$ $\rightarrow a \cdot ABe$ ； $\rightarrow \cdot Abc$ ； $\rightarrow \cdot b$

识别文法G活前缀的DFA通过下面的方式构造：

令 $\{closure(S' \rightarrow S)\}$
对 $C$ 中的每一个项目集应用转换函数goto(I, X)得到新的项目集 $I_n$ ，并把 $I_n$ 加入到 $C$ 中。
重复第二步，直到 $C$ 不再增大为止。

根据DFA构建SLR分析表

状态i从 $I_i$ 构造，它的action函数如下确定：

如果 $\rightarrow \alpha \cdot a \beta ]$ 在 $I_i$ 中，并且goto( $I_i$ ,a )= $I_j$ ，那么置action[i, a]为 $s_j$ 。
如果 $\rightarrow \alpha \cdot ]$ 在 $I_i$ 中，那么对FOLLOW(A)中的所有终结符a，置action[i, a]为 $r_j$ ， $j$ 是产生式 $\rightarrow \alpha \cdot$ 的编号。
如果 $\left[ \mathcal { S } ^ { \prime } \rightarrow \mathcal { S } \cdot \right]$ 在 $I_i$ 中，那么置action[i, ?]为接受acc。

如果出现动作冲突，那么该文法就不是SLR(1)的。

构造状态i的goto函数：
对所有的非终结符A，如果goto( $I_i$ ,A)= $I_j$ , 那么goto[i, A]= $j$ 。

不能由上面两步定义的条目都为error。

SLR(1)文法的问题

每个SLR(1)文法都不是二义的，但是，有许多非二义的文法不是SLR(1)，文法描述能力弱。SLR(1)是在构造完DFA的LR(0)项目集之后才应用预测符号的，即对需要归约的产生式，当其遇到产生式左部非终结符的FOLLOW集中的终结符时才进行归约，而在LR(0)的构造中没有考虑预测。

构造规范的LR分析表

基本步骤同SLR一样，只在第二步和第三步时有所不同，只说不同的地方。

构建识别活前缀的DFA

使用LR(1)文法，1表示项目 $\rightarrow \alpha \cdot \beta , a]$ 中搜索符的长度。
LR(1)闭包函数closure(I)

I中的所有项都属于closure(I)
若 $[A\rightarrow \alpha \cdot B \beta, a]$ 属于closure(I)， $B\rightarrow \gamma$ 是产生式，则对于每个终结符b $\in FIRST(\beta a)$ ，项 $[B\rightarrow \cdot \gamma ,b]$ 也加入到closure(I)中。
重复上面两个步骤，直至closure(I)不再变化。

搜索符b的集合是FOLLOW(B)的一个子集。

LR(1)状态转换函数goto(I, X)
I状态集中所有形如 $\rightarrow \alpha \cdot X \beta,b ]$ 的产生式对应的产生式 $\rightarrow \alpha X \cdot \beta,b ]$ 的LR(1)闭包。X为终结符或非终结符。注意这里的搜索符集b是直接由前面对应的项目抄过来的。

识别文法G活前缀的DFA通过下面的方式构造：

令 $\{closure([S' \rightarrow S, doller ])\}$ 注：这里的doller指$，latex解析不正确这样代替一下…
对 $C$ 中的每一个项目集应用转换函数goto(I, X)得到新的项目集 $I_n$ ，并把 $I_n$ 加入到 $C$ 中。
重复第二步，直到 $C$ 不再增大为止。

根据DFA构建SLR分析表

基本同SLR，不同点在于：在action函数中，如果有归约，SLR是根据左部非终结符的FOLLOW集决定进行归约；LR(1)是根据搜索符决定进行归约。

LR(1)文法的问题

LR(1)文法描述能力较强，但是由于状态数目多，分析表较大。

构造LALR分析表

LALR是在SLR(1)和LR(1)之间进行了文法描述能力与分析表紧凑程度之间做的折中。

LALR的做法

合并识别LR(1)文法的活前缀的DFA中的同心项目集。

同心项目集

略去搜索符后相同的项目集。
? $\rightarrow \cdot b B$ 和 $\rightarrow \cdot b B ,b / a$

合并同心集引起的冲突

同心集的合并不会引起新的移进-归约冲突。
?如果同心集中有移进-归约冲突 $\left[ A \rightarrow \alpha \cdot, a / b \right]$ $\rightarrow \beta \cdot a \gamma , c / d ]$ ，当面对输入符号a时不知道该移进还是归约。合并前的项目集应该有 $\left[ A \rightarrow \alpha \cdot, x \right]$ $\rightarrow \beta \cdot a \gamma , y ]$ ，肯定有个x为a，所以一定存在移进-归约冲突，说明合并之前就存在移进-归约冲突了。

同心集的合并有可能产生新的归约-归约冲突。
?合并前项目集 $\rightarrow c \cdot, d]$ $\rightarrow c \cdot, e]$ 和 $\rightarrow c \cdot, e]$ $\rightarrow c \cdot, d]$ ，合并后为
$\rightarrow c \cdot, e/d]$ $\rightarrow c \cdot, d/e]$ ，此时就产生了新的归约-归约冲突。