[编译原理]Stanford斯坦福CS143第四周第七章

最新推荐文章于 2024-03-09 11:52:53 发布

BadGalDesperado

最新推荐文章于 2024-03-09 11:52:53 发布

阅读量294

点赞数

分类专栏：编译原理文章标签：编译器

本文链接：https://blog.csdn.net/m0_45338067/article/details/113000968

版权

编译原理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文详细介绍了预测解析的概念，包括LL(1)解析表的构建过程，如FirstSets和FollowSets的定义，以及如何解决左递归和左因子化问题。通过具体的例子展示了如何为给定的文法生成LL(1)解析表，并分析了非LL(1)文法的特征。此外，还简要提到了自底向上的解析方法。

摘要由CSDN通过智能技术生成

预测解析（Predictive Parsing)

预测解析有些类似递归下降解析但是通过以下方法可以预测使用规则中的哪一个Production：

通过观察后面几个tokens（Look ahead，只用于有限的语法）
不回退

预测解析支持 $\ derivation,k\ tokens\ lookahead）$ 语法。（我们只讨论 $k = 1$ 的情况）

在 $L L (K)$ 中：

每一步只有一种Production可以选择（对于语法的要求）

考虑我们前面见过的语法：

$E\ ->\ T\ |\ T\ +\ E$
$T\ ->\ int\ |\ int\ *\ T\ |\ (\ E\ )$

这个语法很难用于预测解析，因为：

$T$ 有两个Production是以 $i n t$ 开始的
$E$ 的预测不明确

所以我们需要 $left\ factor$ 这个语法，即删除一个规则的相同前缀。对于上面的语法修改，可以将匹配决策推迟：

$E\ ->\ TX$
$X\ ->\ +E\ |\ ε$
$T\ ->\ intY\ |\ (E)$
$Y\ ->\ ε\ |\ *T$

解析表

根据上面left parsing之后的语法，可以生成一个 $L L (1)$ 的解析表：

	int	*	+	(	)	$
E	TX			TX
X			+E		ε	ε
T	intY			(E)
Y		*T	ε		ε	ε

最左边一列是当前解析树中的非终端；第一行是下一个输入令牌；表格内的数据是当前终端遇到下一个令牌所采用的Production；表格中的空项都是表示错误输入。

先找最左的非终端 $S$
看下一个令牌 $a$
查看表选择Production表示的是 $[S, a]$

需要用一个堆栈保存解析树的边界：

还没有扩展的非终端
和输入匹配不成功的非终端
栈顶=最左将要匹配的终端或非终端

结束条件：

当遇到错误状态时，拒绝，结束
当输入结束并且栈为空，接收，结束

算法伪码：

initialize stack = <S $> and next //这里S是起始符号,$不是合法语法,而是标识输入结束,next初始指向当前字符串的第一个元素
repeat
	case stack of
		<X, rest> :  //栈顶是一个非终端
			if T[X, *next] = Y1...Yn //查看解析表T
			then stack <- <Y1...Yn rest>;	//将X取出堆栈，换成Y1...Yn(Y1成为新栈顶)
			else error();
		<t, rest> :	//栈顶是一个终端
			if t == *next++
			then stack <- <rest>;
			else error();
until stack == <>

举例：

在这里插入图片描述

First Sets

下面考虑如何构建解析表：

考虑一个非终端 $A$ ，有Production $A\ ->\ α$ 和输入的token $t$ 。
则 $T [A . t] = α$ 有两种情况：

有 $α\ ->^*\ tβ$ ，即α可以在第一个位置生成 $t$ ，那么就有 $t \in F i r s t (α)$ 、
有 $A\ ->\ α,\ α\ ->^*ε,\ S\ ->^*βAtσ$ 。这个情况适用于堆栈中有 $A$ ，输入为 $t$ ，并且 $A$ 不能演化成 $t$ （即 $t$ 不输入 $F i r s t (α)$ ），这种情况下就是要消去 $A$ （通过生成ε），但是这只适用于在至少一个演化后， $t$ 可以出现在 $A$ 后面，我们称 $t \in F o l l o w (A)$ 。

定义

在这里插入图片描述
举例：

还是考虑如下语法：

$E\ ->\ TX$
$X\ ->\ +E\ |\ ε$
$T\ ->\ intY\ |\ (E)$
$Y\ ->\ ε\ |\ *T$

左边是终端的 $First\ Sets$ ，右边是非终端的。

在这里插入图片描述

Follow Sets

定义

在这里插入图片描述

算法框架：
举例：

还是考虑这个语法：

$E\ ->\ TX$
$X\ ->\ +E\ |\ ε$
$T\ ->\ intY\ |\ (E)$
$Y\ ->\ ε\ |\ *T$

分析：

从第一个可以推断出 $F o l l w (X)$ 是 $F o l l o w (E)$ 的子集，而从第而个可以推断出 $F o l l w (E)$ 是 $F o l l o w (X)$ 的子集，可以得出 $F o l l o w (E) = F o l l o w (X)$ 。
结合1、2可以得出 $F o l l o w (E)$ 是 $F o l l o w (T)$ 的子集。
从第四个可以得到 $F o l l o w (Y)$ 是 $F o l l o w (T)$ 的子集。从第三个可以得出 $F o l l o w (T)$ 是 $F o l l o w (Y)$ 的子集，因此 $F o l l o w (Y) = F o l l o w (T)$ 。