编译原理笔记

最新推荐文章于 2024-09-12 19:02:20 发布

kxz20

最新推荐文章于 2024-09-12 19:02:20 发布

阅读量188

点赞数

文章标签：算法

本文链接：https://blog.csdn.net/qq_50839455/article/details/127245323

版权

文章目录

语法分析

语法分析

元素

LL(1)分析
First 集合
Follow 集合
文法 $G=(V_N, V_T, P, S)$ ，其中 $V_N$ 是非终结符， $V_T$ 是终结符， $P$ 是产生式， $S$ 是起始符号
产生式的后缀 $u$ (自取，表示产生式箭头后的部分)
预测集合 $PS(A\rightarrow \alpha)$ ，其中 $A\rightarrow \alpha$ 是一个产生式
预测分析表 $M$
下推栈和余留字符串
递归下降LL(1)分析程序
左递归的文法(直接左递归，间接左递归)
无回路的文法
左公因子

符号表示

$S$ 为一个字符集合，那么 $S^*$ 表示这个集合中的所能组合成的所有句子，包括 $\varepsilon$
例子：{“ab”, “c”}* = {ε, “ab”, “c”, “abab”, “abc”, “cab”, “cc”, “ababab”, “ababc”, “abcab”, “abcc”, “cabab”, “cabc”, “ccab”, “ccc”, …}

关系

给定一个文法 $G$ 和一个集合 $X_G$ ，其中 $X_G \subset \{V_N \cup V_T\}^*$ ，求这个集合 $X_G$ 的first集合
1. 先求 $\{V_N \cup V_T\}$ 的first集合
  1. 对于 $G$ 中的任何一个终结符 $a$ ， $first(a)=\{a\}$ ，包括 $first(\varepsilon)=\{\varepsilon\}$ ;对于 $G$ 中任何一个非终结符 $A$ ， $first(A)=\varnothing$
  2. 求 $G$ 的所有产生式的后缀 $u$ 的first集合
    举例，如产生式后缀 $D a B$ ，假设 $\varepsilon}$ ， $first(B)={b}$
    1. 对于任意一个 $u$ ， $first(u)=\varnothing$
    2. 遍历 $u$ 的所有字符
    3. 如果遇到的是一个非终结符 $A$ ，
      1. 那么遍历它的first集合，将其终结符加入 $f i rs t (u)$ 中(包括 $v a re p s i l o n$ )
      2. 如果 $\varepsilon \in first(A)$ ，那么继续查看下一个字符
      3. 否则将 $f i rs t (u)$ 中的 $v a re p s i l o n$ 删掉，直接退出
    4. 如果遇到的是一个终结符 $a$
      1. 将 $a$ 加入 $f i rs t (u)$ ，将 $f i rs t (u)$ 中的 $v a re p s i l o n$ 删掉，退出
    以 $D a B$ 为例， $D$ 的所有终结符 $d$ 加入 $f i rs t (u)$ ， $D$ 有 $\varepsilon$ 元素，那么查看下一个，下一个是终结符 $a$ ，将 $a$ 加入 $f i rs t (u)$ ，退出，所以 $first(u)=\{d,a\}$
  3. 将 $G$ 的所有产生式的后缀 $u$ 的first集合赋给其对应的非终结符
  4. 回到2，进行循环，直到集合中所有 $u$ 的first集合相对于上一轮都不再变动
2. $X_G$ 中字符串的first集合可以以1.1.2中的方法计算出来，所有的字符串的集合累积到一起就是 $X_G$ 的first集合
给定一个文法 $G$ ，对所有属于 $V_N$ 的非终结符 $A$ ，求 $F o ll o w (A)$
给定一个文法 $G$ 和其中的一个产生式 $A\rightarrow \alpha$ 求这个产生式的预测集合
1. 如果 $\varepsilon \notin First(\alpha)$ ，那么 $PS(A\rightarrow \alpha)=First(\alpha)$
2. 如果 $\varepsilon \in First(\alpha)$ ，那么 $PS(A\rightarrow \alpha) = (First(\alpha)-\{\varepsilon \})\cup Follow(A)$
给定一个文法 $G$ ，判断该文法是否是LL(1)的
文法 $G$ 是LL(1)的，当且仅当对于 $G$ 中任何两个相同左部的不同产生式 $A\rightarrow \alpha$ 和 $A\rightarrow \beta$ ，都满足 $PS(A\rightarrow \alpha)\cap PS(A\rightarrow \beta)=\varnothing$
给定一个文法 $G=(V_N,V_T,P,S)$ ，求它的预测分析表 $M$
1. 搭建表的框架，表的每一行都对应 $G$ 的一个非终结符，表的每一列对应 $G$ 的所有终结符加上#符号
2. 往表内填写内容，检查文法的每一个产生式 $A\rightarrow \alpha$ ，若它的预测集合 $PS(A\rightarrow \alpha)$ 中包含 $a\in V_T\cup \{\#\}$ ，则将 $A\rightarrow \alpha$ 加入 $M [A, a]$ （即表 $M$ 中 $A$ , $a$ 对应的位置）
给定一个文法 $G$ 与它的预测分析表，求它的LL(1)分析过程
1. 创建两个栈：下推栈和余留字符串，并将#号分别推入两个栈中
2. 将初始符号 $S$ 推入下推栈，将输入的符号串推入余留字符串(注：右边的字符先入栈)
3. 检查下推栈栈顶
  1. 如果栈顶是终结符，那么比对下推栈和余留字符串的栈顶是否匹配，若匹配就将两个栈顶都弹出，不匹配就进行错误处理。
  2. 如果栈顶是非终结符，则以该非终结符和余留字符串的栈顶作为坐标到预测分析表中查找，如果对应位置是一个产生式，那么将下推栈栈顶出栈，并将该产生式的后缀入栈(注：右边的字符先入栈)；如果对应位置为空，那么报错
4. 回到3进行循环，直到两栈栈顶同时为#，分析结束
给定一个文法 $G$ ，写出它的递归下降LL(1)分析程序
1. 先求出 $G$ 中所有非终结符的预测集合
2. 对于 $G$ 中的每一个非终结符 $A$ ，
  1. 找到 $A$ 的产生式集合 $A\rightarrow u_1|u_2|...|u_n$
  2. 写出它的一个函数void ParseA()，其结构为
```
	void ParseA(){
		switch (lookahead){
			case PS(A->u1):
				...
				break;
			case PS(A->u2):
				...
				break;
			...
			case PS(A->un):
				...
				break;
			default:
				printf("syntax error\n");
				exit(0);
		}
	}
	// 这里lookahead是一个全局变量，存放扫描的终结符
```
  3. 对于每一个case，遍历其产生式后缀从左到右的符号
    1. 如果是一个终结符 $a$ ，那么写上一句MatchToken(a);
    2. 如果是一个非终结符 $A$ ，那么写上一句ParseA();
3. 给出MatchToken的逻辑
```
	void MatchToken(int expected){
		if (lookahead != expected){
			printf("syntax error\n");
			exit(0);
		}
		else
			lookahead = getToken();
	}
```
给定一个含有直接左递归的产生式，将其消除左递归
假设这个产生式为
$P\rightarrow P\alpha_1|P\alpha2|...|P\alpha_m|\beta_1|\beta_2|...|\beta_n$
其中 $\alpha_i\neq \varepsilon$ ， $\beta_j$ 不以 $P$ 开头
1. 增加一个非终结符 $Q$
2. 将产生式改为
  $\begin{align*} &P\rightarrow \beta_1Q|\beta_2Q|...|\beta_nQ\\ &Q\rightarrow \alpha_1Q|\alpha_2Q|...|\alpha_mQ|\varepsilon \end{align*}$
给定一个无回路，无 $\varepsilon$ 产生式的文法，将其消除左递归(包括两种左递归)
(一般题目给定的应该就是无回路也无 $\varepsilon$ 产生式的文法)
1. 以某种顺序(随便的顺序)将文法非终结符排列成 $A_1, A_2,...A_n$
2. 进行消除
3. 化简从2中得到的产生式集
给定一个产生式，提取其左公因子
假设该产生式为
$P\rightarrow \alpha \beta_1|\alpha \beta_2|...|\alpha \beta_m|\gamma_1|\gamma_2|...|\gamma_n$
1. 增加一个非终结符 $Q$
2. 改写产生式为
  $\begin{align*} &P\rightarrow \alpha Q|\gamma_1|\gamma_2|...|\gamma_n\\ &Q\rightarrow \beta_1|\beta_2|...|\beta_m \end{align*}$