编译原理（六）

最新推荐文章于 2024-04-02 11:01:37 发布

antRain

最新推荐文章于 2024-04-02 11:01:37 发布

阅读量1.1k

点赞数 2

分类专栏：编译原理文章标签：编译原理

本文链接：https://blog.csdn.net/qq_41146650/article/details/102574808

版权

编译原理专栏收录该内容

16 篇文章 5 订阅

订阅专栏

编译原理（六）

- - 自下而上的语法分析

自下而上的语法分析

最左推导(Left-most Derive):每一步推导都替换当前句型的最左边的非终结符。
——其逆过程称为最右归约
最右推导(Right-most Derive):每一步推导都替换当前句型的最右边的非终结符。
——其逆过程称为最左归约(规范归约)，得规范句型
有文法G，开始符号为S, 如果有 $S\overset{*}{\Rightarrow}xβy$ ,则xβy是文法G的句型，x,y是任意的符号串
- 如果有 $S\overset{*}{\Rightarrow} xAy, 且有A\overset{+}{\Rightarrow}β,$ 则β是句型xβy相对于非终结符A的短语
- 如果有 $S\overset{*}{\Rightarrow} xAy, 且有A\rightarrow β,$ 则β是句型xβy相对于 $A\rightarrow β$ 的直接短语
位于一个句型最左边的直接短语称为句柄.
规范归约
- 假定α是文法G的一个句子，如果序列： $α_n, α_{n-1}, ……, α_0 (=S)$ 满足如下条件，则序列 $α_n, α_{n-1}, ……, α_0$ 是一个规范归约:
  (1) $α_n =α$ 是给定的句子
  (2) $α_0 =S$ 是文法的开始符号
  (3) 对任何i, $\leq n，α_{i-1}$ 是从 $α_i$ 经把句柄替换为相应文法产生式的左部符号而得到的。
- 规范归约是最右推导的逆过程，又称为最左归约。
- 最右推导又称规范推导，由规范推导所得到的句型称规范句型，规范推导的逆过程是规范归约。
分析器的四种动作
- 移进：将下一输入符号移入栈
- 归约：当栈顶出现句柄，用产生式左侧的非终结符替换栈顶的句柄
- 接受：分析成功，是归约的一种特殊情况
- 出错：栈顶的内容与输入符号相悖，进行出错处理
LR分析法：L——从左向右扫描输入串，R——构造最右推导的逆过程
action[S_i,a_j]，指出如果当前栈顶为状态S_i，输入符号为a_j时应执行的动作。其动作有四种可能。
goto[S_i,x_j]指出状态为S_i，遇到X_j时应转到的下一状态
分析表定义了一个以文法符号为字母表的DFA

LR(0)分析

活前缀：规范句型的一个前缀，不含句柄之后的任何符号。在它之后增添一些终结符号后，就成为规范句型。即：
对于文法G，若 $S\overset{*}{\Rightarrow}\alpha \beta, \beta \in V_T^*$ ，称 $\alpha$ 为活前缀。
LR(0)项目：在文法G中每个产生式的右部适当位置添加一个圆点构成项目
后继符号：在项目中紧跟在符号“·”后面的符号称为该项目的后继符号
- 移进项目：后继符号为终结符： $A\rightarrow α· aβ$
- 待约项目：后继符号为非终结符： $A\rightarrow α· Bβ$
- 归约项目：后继符号为空：即圆点在最右边 $A\rightarrow α·$
- 接受项目：归约项目的左边是文法开始符号 $S\rightarrow α·$
后继符号集：项目集中各项目的后继符号所组成的集合称为后继符号集。项目集｛ $\rightarrow E ·＋T,F\rightarrow ·i$ ｝的后继符号集为｛＋,i｝

构造NFA

写出文法的所有项目，每个项目是一个状态
规定项目1: $\rightarrow \cdot S$ 为NFA的唯一初态
若状态i和状态j出自同一产生式，而且状态j的圆点只落后于状态i一个位置:
- 若i的圆点后是终结符a，从i到j画一条弧，标记为a
- 若i的圆点后是非终结符A，则连两种弧：(1)从状态i画ε弧到所有的A→·β的状态。(2)从状态i到j画弧，标记为A
归约项目表示结束状态，用双圈表示,双圈外加*表示句子接受态acc

直接使用闭包和状态转换函数

一个项目集I的闭包Closure(I)的计算：
(1) I中的任何项目都 $\in Closure(I)$
(2) 若 $\rightarrow \alpha \cdot B \beta 在Closure(I),且 B \in V_N$ ，则对任何关于B的产生式： $\rightarrow \cdot r \in Closure(I)$ ，r为任意符号串
(3) 重复(2)直到Closure(I)不再增加为止。
其中(2)的条件表示所有项目集中右边为·B的状态与B $\rightarrow \cdot$ 的状态是等价的，因此，只要 $\rightarrow \cdot \alpha$ 进入Closure(I)中, 则所有B的圆点在左边的项目 $\rightarrow \cdot β$ 都应进入同一个Closure(I)中。
状态转换函数GO(I,X)的计算：
GO(I,X) = Closure(J) = Closure(move(I,X))
I是一个项目集，X是一个文法符号
其中J = {任何形如 $\rightarrow \alpha X·\beta$ 的项目| $A\rightarrow \alpha \cdot X \beta I$ }

LR(0)项目集规范族的构造算法

拓广文法：在原文法G[S]上增加一个产生式 $\rightarrow S$ ，这是为了得到唯一的接受状态 $\rightarrow S ·$
设项目集规范族C只包含第一个状态{S’→ · S}的闭包，即C = { Closure({S’ → · S}) }
利用GO函数对C中的每个项目集和每个符号X计算其下一状态，并将下一状态GO(I,X)加入到C中，直到C中状态数不再增加
- 如果 $GO(I,X)\neq \varnothing 且GO(I,X)\notin C 把GO(I,X)加入C中$
- 在I和GO(I,X)之间添加标记为X的弧线

LR(0)分析表的构造

设有文法G，则从LR(0)项目集规范族构造分析表的方法为：

对于 $\rightarrow \alpha ·X\beta \in I_k，GO (I_k,X)=I_j$
- 若 $\in V_T，则置action[k,X]=S_j$ ,即把(j,a)移进栈
- 若 $\in V_N$ ，则置 $g o t o [k, X] = j$
对于 $A\rightarrow \alpha · \in I_k$ ，则对所有的 $x\in V_T$ 和# ，均置action[k,x]= $r_j$ (设 $A\rightarrow \alpha$ 是文法G’第j个产生式)，即用 $A\rightarrow \alpha$ 归约
若 $\rightarrow S · \in I_k$ ，则置action[k,#]=acc，即接受
其他均置出错。

SLR分析方法

若一个项目集中同时含有移进和归约项目，出现了冲突。
解决冲突的条件：移进符号集合{b}, Follow(A), follow(B)两两不相交。
解决的办法：当面临的输入符号为a：
- 当a =b，则应移进；
- 当a ∈follow(A)，则用产生式 $A\rightarrow β$ 进行归约；
- 当a ∈follow(B)，则用产生式 $B\rightarrow γ$ 进行归约。

SLR(1)分析表的构造算法

构造LR(0)的项目集规范族及识别活前缀的DFA
判断冲突
对每个冲突，计算规约项目左部符号的Follow集
检查每个状态和每条边
- $A\rightarrow \alpha \cdot \beta \in I_k 且GO(I_k,X)=I_j 若X \in V_T，则置action[k,X]=S_j ,即把(j,a)移进栈,若X \in V_N，则置goto[k,X]=j$
- $对于A\rightarrow \alpha \cdot \in I_k ，则对所有的a\in V_T(或结束符\#), a\in Follow(A)，则置action[k,a]=r_j (设A\rightarrow \alpha是第j个产生式)，即用A \rightarrow \alpha 归约$
- 若 $S'\rightarrow S · \in I_k$ ，则置action[k,#]=acc，即接受
- 其他均置出错。

LR(1)分析

LR(0)项目：为 $A→α·β,a_1a_2…a_k]，A→α·β是一个LR(0)项目，a_i∈V_T^*$ 。

闭包Closure(I)

闭包Closure(I)
- 将I中的所有项目都加入Closure(I)。
- 若项目[A→α·Bβ,a]∈Closure(I)，B→γ是一个产生式，那么对于任何b∈First(βa)，如果[B→·γ,b]原来不在Closure(I)中，则把它加进去。重复执行该过程，直到Closure(I)不再增大为止。
I是一个项目集，X是一个文法符号，则转换函数GO(I,X)定义为：GO(I,X) = Closure(J)，J=｛任何形如[A→αX·β,a]的项目 | [A→α·Xβ,a]∈I｝。

项目集规范族及识别活前缀的DFA

拓展文法，写出所有项目
C={Closure ({[S’→ ·S,#]})};
C中的每个项目集I和G’的每个符号X 求GO(I,X)
- 如果 $GO(I,X)\neq \varnothing 且GO(I,X)\notin C 把GO(I,X)加入C中$
- 在I和GO(I,X)之间添加标记为X的弧线
重复上一条步骤，直到C不再增大

LR(1)分析表

若项目 $A→α·aβ,b]∈I_k，且GO(I_k,a)=I_j，其中a∈V_T，则置action[k,a]=S_j$ 。即把输入符号a和状态j分别移入文法符号栈和状态栈。
若项目 $A→α·,a]∈I_k，其中a∈V_T，则置action[k,a]=r_j$ ，即用产生式A→α进行归约，j是在文法中对产生式A→α的编号。
若项目 $S'→S·,\#]∈I_k$ ，则置action[k,#]＝acc，表示接受。
若 $GO(I_k,A)＝I_j，其中A∈V_N，则置goto[k,A]＝j$ 。表示当栈顶符号为A时，从状态k转换到状态j。
其他均置"报错标志"。

LALR(1)分析

在LR(1)分析表中，若存在两个状态（项目集）除向前搜索符不同外，其它部分都是相同的，称这样的两个LR(1)项目集是同心的。

LALR分析表

构造LR(1)项目集规范族， $C={I_0，I_1，…，I_n}$ 。
合并所有的同心集，得到LALR(1)的项目集族 $C'={J_0，J_1，…，J_m}$ 。含有项目[S’→·S,#] 的J_k为初态。
由C’构造动作(action)表。
- 若 $A→α·aβ,b]∈J_k，且GO(J_k,a)＝J_j，其中a∈V_T$ ，则置 $action[k,a]=S_j$ ，
- 若项目 $A→α·,a]∈J_k$ ，其中 $a\in V_T$ ，则置action[k,a]=r_j，r_j的含义是按产生式A→α进行归约
- 若项目 $[S'→S·,\# ] \in I_k$ ，则置action[k,#]=acc，表示分析成功，接受。
goto表的构造。若不是同心集的项目集，转换函数的构造与LR(1)的相同；假定 $I_{i1},I_{i2}，…，I_{in}$ 是同心集，合并后的新集为J_k，转换函数 $GO(I_{i1},X)，GO(I_{i2},X)，…，GO(I_{in},X)$ 也为同心集，将其合并后记作 $J_i$ ，因此，有 $GO(J_k,X)= J_i$ ，所以当X为非终结符时， $GO(J_k,X)=J_i$ ，则置goto[k,X]=i，表示在k状态下遇到非终结符X时，把X和i分别移到文法符号栈和状态栈。
其他空白均填上“出错标志”。