编译原理4——自上而下的分析方法

最新推荐文章于 2024-03-30 21:18:35 发布

皎月既望

最新推荐文章于 2024-03-30 21:18:35 发布

阅读量154

点赞数

分类专栏：编译原理复习分享文章标签：学习

本文链接：https://blog.csdn.net/weixin_65518198/article/details/134433219

版权

6 篇文章 0 订阅

订阅专栏

4.1 语法分析器的功能

任务：在词法分析器识别出单词符号串的基础上，分析并判定语法结构是否符合语法规则

自上而下分析：
对任何输入串，试图用一切可能的办法，从文法开始符号（根结）出发，自上而下地为输入串建立一棵语法树
$\star$ 实质上是一种不断试错的过程

回溯
当新发展的子树无法满足字符串时，需要退掉子树，看是否还有其他候选
左递归
类似 $P\xRightarrow{+}P\alpha$ 的结构将使得分析陷入死循环
简单说，当 $P$ 的其他子树无法满足字符串时，则 $P$ 会选择 $P\xRightarrow{+}P\alpha$ 子树，但该子树的开头仍是 $P$ ，问题得不到根本解决，于是下一个 $P$ 又选择 $P\xRightarrow{+}P\alpha$ ，开始死循环
选配成功是暂时的，如用 $\alpha**\beta$ 去匹配 $\alpha*i\beta$ ，需要复杂的回溯解决该问题
无法知道出错的确切位置
$\star$ 上下文无关文法：2型文法
$\star$ 有限自动机：3型文法

自上而下的分析，试错过程占大头，LL(1)分析法就是要每次发展子树都明确应该发展哪个

消除直接左递归：
$P\rightarrow P\alpha|\beta$
替换为：
$\begin{matrix}P\rightarrow\beta P'\\P'\rightarrow\alpha P'|\varepsilon\end{matrix}$
消除间接左递归：
1. 间接左递归变直接左递归
2. 消除直接左递归
  例：
  间接左递归语言： $\begin{matrix}S\rightarrow Qc|c\\Q\rightarrow Rb|b\\R\rightarrow Sa|a\end{matrix}$
  存在： $S\Rightarrow Qc\Rightarrow Rbc\Rightarrow Sabc$ （间接回溯）
  修改为： $S\rightarrow Sabc|abc|bc|c$
  消除直接左递归： $\begin{matrix}S\rightarrow abcS'|bcS'|cS'\\S'\rightarrow abcS'|\varepsilon\end{matrix}$

目的：使得分析器能够根据面临输入符号准确指派执行任务（使得能根据待匹配字符去发展子树）

$FIRST(\alpha)$
$FIRST(\alpha)=\{a|\alpha\xRightarrow{*}a\cdots,a\in V_{T}\}$
$\star$ 若 $\alpha\xRightarrow{*}\varepsilon$ ，则 $\varepsilon\in FIRST(\alpha)$
1. 消除回溯的条件
  $FIRST(\alpha_i)\cap FIRST(\alpha_j)=\phi$
提取公共左因子
例：
回溯语言： $A\rightarrow\delta\beta_1|\delta\beta_2|\cdots|\delta\beta_n|\gamma_1|\gamma_2|\cdots\gamma_m$
提左因子： $\begin{matrix}A\rightarrow\delta A'|\gamma_1|\gamma_2|\cdots|\gamma_m\\A'\rightarrow\beta_1|\beta_2\cdots|\beta_n\end{matrix}$

$FO LL O W (A)$
$FOLLOW(A)=\{a|S\xRightarrow{*}\cdots Aa\cdots,a\in V_T\}$
$\star$ 若 $S\xRightarrow{*}\cdots A$ ，则 $\#\in FOLLOW(A)$
不带回溯的自上而下分析的文法（LL(1)文法）
构造条件
1. 不含左递归（出问题时不能把问题抛给子树中的自己）
2. 若 $A\rightarrow\alpha_1|\alpha_2|\cdots|\alpha_n$ ，则 $FIRST(\alpha_i)\cap FIRST(\alpha_j)=\phi$ （匹配上时只有一条子树可走）
3. 若非终结符 $A$ 的某个候选首符集包含 $\varepsilon$ ，则 $FIRST(A)\cap FOLLOW(A)=\phi$ （必须明确给子还是给兄弟解决）
  策略
4. 若 $a\in FIRST(\alpha_i)$ ，则指派 $\alpha_i$ 去执行任务
5. 若 $a$ 不属于任何一个候选首符集，则：
  1. 若 $\varepsilon$ 属于 $FIRST(\alpha_i)$ 且 $a\in FOLLOW(A)$ ，则让 $A$ 与 $\epsilon$ 自动匹配
  2. 否则， $a$ 出现是一种语法错误

简单说就是按照上面的构造明确如何按照句子自上而下发展LL(1)语法分析树
另外引入了一个扩充巴克斯范式

本质上就是4.4的延伸

本质上是根据定义的 $F I RST$ 来确定位置，如果 $E$ 的某一定义 $P$ 的 $F I RST$ 中有终结符 $\alpha$ ，则将分析表中 $(\alpha,E)$ 位置设置为 $P$
具体操作：

若 $X\in V_T$ ，则 $FIRST(X)=\{X\}$
若 $X\in V_N$ ，且有产生式 $X\rightarrow a\cdots$ ，则把 $a$ 加入到 $F I RST (X)$ 中；若 $X\rightarrow\varepsilon$ 也是一条产生式，则将 $\varepsilon$ 也加到 $F I RST (X)$ 中
若 $X\rightarrow Y\cdots$ 是一个产生式且 $Y\in V_N$ ，则把 $F I RST (Y)$ 中所有非 $\varepsilon$ -元素都加到 $F I RST (X)$ 中；若 $X\rightarrow Y_1Y_2\cdots Y_k$ 是一个产生式， $Y_1,\cdots,Y_{i-1}$ 都是非终结符且 $F I RST$ 中含有 $\varepsilon$ ，则将 $FIRST(Y_i)$ 中的元素加入 $F I RST (X)$ 中；若 $Y_1,\cdots,Y_{k}$ 都是非终结符且 $F I RST$ 中含有 $\varepsilon$ ，则将 $\varepsilon$ 加入 $F I RST (X)$ 中
重复上述操作至集合不再发生变化
递归查找各个非终结符的产生式也行
$\star$ 如果已知文法是无二义的，则无需查看 $FO LL O W$ 集合
$\star$ 如果文法 $G$ 是左递归或二义的，则 $M$ 至少含有一个多重入口