编译原理 3 - 语法分析

Safforn

于 2023-07-20 12:01:19 发布

阅读量70

点赞数

分类专栏：笔记文章标签：编译原理

本文链接：https://blog.csdn.net/qq_50918834/article/details/127708309

版权

笔记专栏收录该内容

33 篇文章 6 订阅

订阅专栏

第4章语法分析（自顶向下）
第5章语法分析（自下向上）
- 5.1 LR(0)文法

语法分析(syntax analysis) 是编译程序的核心部分，其任务是检查词法分析器输出的单词序列是否是源语言中的句子

第4章语法分析（自顶向下）

4.1 自上而下分析的问题：

① 回溯问题
分析过程中，当一个非终结符用某一个候选匹配成功时，这种匹配是暂时的；出错时，不得不进行“回溯”
示例：对于具有两个候选式的A，第一次匹配时选择 A → ** 时，后续匹配失败
这时，回溯到对 A 的候选时，选择下一个候选式 A → *，继续匹配后续字符。最后成功。
② 文法左递归问题
如果一个文法存在非终结符 P 使得 $\Rightarrow^{+} P \alpha$ ，则该文法含有左递归，导致分析器进入死循环

③ 二义性

4.2 消除左递归

消除直接左递归
- 问题：形如 $P\rightarrow P\alpha | \beta$ (其中 $\beta$ 不以 $P$ 开头)的文法，会变成 $P\Rightarrow P\alpha \Rightarrow P\alpha\alpha ... \Rightarrow \beta\alpha\alpha...$
- 思路：设计一种文法，也能达到上述文法的效果，而不存在左递归等死循环
- 解决：左递归变右递归。上述文法可以转换为 $P\rightarrow \beta P'$ ， $P'\rightarrow \alpha P' | \epsilon$
消除间接左递归
- 问题：问题：形如 $S\rightarrow Qc| c$ ， $Q\rightarrow Rb|b$ ， $R\rightarrow Sa|a$ 的文法，会变成 $S\Rightarrow Qc\Rightarrow Rbc \Rightarrow Sabc...$
- 解决的前提条件：① 不含以 $\epsilon$ 为右部的产生式；② 不含回路 $P\Rightarrow^+ P$ （非终结符推出本身，没有其他符号）
- 解决：将循环中的非终结符排序RQS，依次替换消除或消除直接左递归即可（排序不同，最终结果不同）

4.3 消除回溯与 LL(1)文法

FIRST集合
- 定义
  令G是一个不含左递归的文法，对G的所有非终结符的每个候选 $\alpha$ 定义它的终结首符集FIRST( $\alpha$ )为：
  $FIRST(\alpha) = \{x | \alpha\Rightarrow^{*} x..., x\in V_T\}$
  特别的，若 $\alpha \Rightarrow^* \epsilon$ ，则规定 $\epsilon \in FIRST(\alpha)$
- 理解： $\alpha$ 能推出的任意串，这个串如果以终结符x开头，则这个终结符 x 就在FIRST集合中；此外FIRST集合中可能存在空字 $\epsilon$
提取公共左因子
- 目的：把每个非终结符(包括新定义的 $A^{'}$ 等)的FIRST集变成两两不相交，进而在匹配字符时，能更准确的匹配某一个候选继续进行匹配，从而“避免”回溯问题
- 缺点：提取公因子不能完全消除回溯，只能不断延后回溯的发生
FOLLOW集合
- 引入
  
  在上面的例子中，我们希望获得一个句型： $E\Rightarrow...\Rightarrow iT'$ + $...$ ，其中的 + 号跟在 $T^{'}$ 后面
- FOLLOW集合定义
  设 S 是文法G的开始符号，对G的所有非终结符A，A的FOLLOW集合为：
  $\{x | S\Rightarrow^{*} ...Ax..., x\in V_T\}$
  特别的，若 $S\Rightarrow^{*} ...A$ ，则规定 # $\in FOLLOW(A)$
- 理解：在某个句型中，跟在非终结符A后面的的终结符 x 在A的FOLLOW集合中
LL(1)文法

第一个 L：left to right，从左到右扫描输入串
第二个 L：leftmost derivation，最左推导
（1）：表示每一步只需向前查看 1 个字符

构造每个文法符号的FIRST集合
对每一个 $A\in V_T\cup V_N$ ，连续使用下面的规则，直至每个集合FIRST不再增大为止：
1. 若 $A\in V_T$ ，A是终结符，则 $FIRST(A) = \{A\}$
2. 若 $A\in V_N$ ，A是非终结符，且有产生式 $A\rightarrow x...$ ，其中 $x$ 是一个终结符，则把 $x$ 加入到 $F I RST (A)$ 中；
  若 $A\rightarrow\epsilon$ 也是一条产生式，则把 $\epsilon$ 也加入到 $F I RST (A)$ 中
3. 若 $A\rightarrow B...$ 是产生式，且 $B$ 是非终结符，则把 $F I RST (B)$ 中的非 $\epsilon$ 元素都加到 $F I RST (A)$ 中
4. 若 $A\rightarrow B_1B_2...B_i...B_k$ 是产生式，且 $B_1B_2...B_{i-1}B_i...B_k$ 都是非终结符
  ① 对于所有 $j$ ， $1 \leq j \leq i - 1$ ， $FIRST(B_j)$ 都含有 $\epsilon$ (即 $B_1...B_{i-1}\Rightarrow^* \epsilon$ )，则把 $FIRST(B_i)$ 中的所有非 $\epsilon$ 元素都加到 $F I RST (A)$ 中
  ② 若所有的 $FIRST(B_j)$ 均含有 $\epsilon$ ， $j = 1, 2, ..., k$ ，则把 $\epsilon$ 加到 $F I RST (A)$ 中
构造任何符号串的FIRST集合
对文法G的任何符号串 $\alpha=X_1X_2...X_n$ 构造集合 $FIRST(\alpha)$
1. 置 $FIRST(\alpha) = FIRST(X_1)$ \ $\{\epsilon\}$
2. 若对任何 $\epsilon\in FIRST(X_j)$ ，则把 $FIRST(X_j)$ \ $\{\epsilon\}$ 加至 $FIRST(\alpha)$ 中
  特别的，若所有的 $FIRST(X_j)$ 都含有 $\epsilon, 1≤j≤n$ ，则把 $\epsilon$ 也加至 $FIRST(\alpha)$ 中
  若 $\alpha = \epsilon$ ，则 $FIRST(\alpha) = \{\epsilon\}$

构造每个非终结符的 FOLLOW集合
对于文法G的每个非终结符A构造FOLLOW(A)，连续使用下面的规则，直至每个FOLLOW集都不再增大为止：
1. 对于文法的开始符号 S，置 # 于 FOLLOW(S)中
2. 若 $A\rightarrow \alpha B\beta$ 是一个产生式，则把 $FIRST(\beta)$ \ $\{\epsilon\}$ 加至 $FO LL O W (B)$ 中
3. 若 $A\rightarrow \alpha B$ 是一个产生式，或 $A\rightarrow \alpha B\beta$ 且 $\beta\Rightarrow^{*} \epsilon$ (即 $\epsilon\in FIRST(\beta)$ )，则把FOLLOW(A)加至FOLLOW(B)中

练习

（4.2节 - 消除直接左递归)

答：对于 E 的左递归，可以变为 $\rightarrow TE'$ ， $\rightarrow +TE' | \epsilon$ ；对于 F 的左递归，可以变为 $\rightarrow FT'$ ， $\rightarrow *FT' | \epsilon$ ；F没有左递归。
（4.2节 - 消除间接左递归）

答：第①步，对非终结符排序：B，A，S
第②步，遍历排好序的非终结符，进行身后变量替换或消除直接左递归
i = 1，B → Sa | a 无直接左递归，也不存在需要替换的身前语法变量
i = 2，A → Bb | b，右侧的B在A前，替换B后得到 A → Sab | ab | b
i = 3，S → Ac | c，右侧的A在S前，替换A得到 S → Sabc | abc | bc | c，发现直接左递归
消除直接左递归，S → abcS’ | bcS’ | cS’，S’ → abcS’ | $\epsilon$
~~第③步，简化得到的文法（学校老师没说qwq ）~~