【学习笔记】编译原理第四章语法分析（基础篇）

最新推荐文章于 2024-09-13 13:42:49 发布

Vera_shsf

最新推荐文章于 2024-09-13 13:42:49 发布

阅读量243

点赞数

分类专栏：编译原理文章标签：编辑器

本文链接：https://blog.csdn.net/b12345678_123/article/details/125787487

版权

6 篇文章 1 订阅

订阅专栏

以下为参考课件与《编译技术》（张莉等著）的个人整理，若有错误欢迎指出

1、语法分析功能：从单词符号串中识别出语法成分，并进行语法检查

2、两大类方法

本文基础篇仅介绍自顶向下分析法的递归子程序法

带预测、需要回溯因此效率低

自顶向下分析方法面临着无法处理左递归（不断调用自身、死循环）和回溯的问题，因此下面讨论解决方法

（1）方法一：使用扩充的BNF改写文法，如 $E::=E+T|T\quad \Longrightarrow E::=T\{T\}$

规则

提取因子

注意：最长匹配规则 $E::=x|xy\quad \overset改\Longrightarrow E::=x(y|\varepsilon) ,不要(\varepsilon|y)$
$\quad \stackrel改 \Longrightarrow U::=(x|y|……)\{v\}$

个别情况不太推荐 $\{\}$ 的写法（原因同下文“回溯”中提到的空语句的情况），更推荐此处使用方法二

（2）方法二：左递归改成右递归

若 $P : : = P α ∣ β$ ，则可改写为 $\varepsilon$

（3）小结：消除一般左递归的算法

步骤：

把文法的非终结符整理成一种顺序，使后面的规则中仅包含前面规则左部的非终结符，如：
$\begin{aligned} A1 &::= δ 1|δ 2|……δ k\\ A2 &::= A1 r……\\ A3 &::= A2u | A1v…..\\ \end{aligned}$
从上往下，依次用上面的规则消去当前规则中的非终结符。这个过程中既可以压缩文法，也可以检查出直接/间接的左递归（用上面提到的方法删除）。

（1）对于规则 $U:=\alpha_1|\alpha_2|...,U \in V_n$ ，定义（每个选择所推出的终结符号串的）首符号集： $FIRST(\alpha_i)=\{a|\alpha_i \stackrel*\Longrightarrow a..., a\in V_t\}$ 。

（2）不带回溯文法的充分必要条件

对于每一个非终结符A的任意两条规则 $A::=\alpha|\beta$ ，下列条件成立：

非左递归
$FIRST(\alpha_i)\cap FIRST(\alpha_j) =\Phi, i \neq j$

也就是每条支路推导出来的字符串无交集，这样就不用试探
若 $\beta \Longrightarrow\varepsilon$ , 则 $FIRST(\alpha) ∩ FOLLOW(A) = \Phi$

A的后继符号集合 $FOLLOW(A)=\{a|Z\stackrel*\Longrightarrow...Aa...,a\in V_t\}$ （特别地，若 $Z\stackrel*\Longrightarrow...A$ ，则 $\varepsilon \in FOLLOW(A)$ ）

这里强调的是推出空语句的影响。如果能推出空语句，那还要求这条之后能推出的所有符号不能与首符号集相交，不然就无法确定到底是这里取到这个符号，还是后续推导得到的。

举一个具体例子：

如 $U::=Ta,T::=a|\varepsilon$ ，如果要对句子 $a$ 进行自顶向下的检查，根据递归子程序法（最左），就不知道 $T$ 这里到底取哪一个了，因此也会带来回溯。