词法分析
来源:龙书(厚),南大课后作业
p130 4.2.1
考虑上下文无关文法:S→S S + | S S * | a
以及串 aa+a*。
- 给出这个串的一个最左推导。
- 给出这个串的一个最右推导。
- 给出这个串的一棵语法分析树。
- 描述这个文法生成的语言。
Answer
- S =lm=> SS* => SS+S* => aS+S* => aa+S* => aa+a*
- S =rm=> SS* => Sa* => SS+a* => Sa+a* => aa+a*
- 只含+和*,操作数均为a的算数表达式的后序遍历
知识点
- 最左推导,最右推导
p147 4.4.1
为下面的文法给出预测分析表。你可能需要首先在你的文法中消除左递归。
(附4.2.2(5)的文法S→ (L) | a , L→L,S | S)
注:题目有所改动,不需要设计预测分析器。
Answer
文法:
S→ (L) | a
L→L,S | S
step1. 无左公因子
step2. 消除左递归
S -> (L) | a
L -> SA
A -> ,SA | ε
step3. 预测分析表
First( S ) = { ( , a } Follow( S ) = { , , $ , ) }
First( L ) = { ( , a } Follow( L ) = { $ , ) }
First( A ) = { , , ε } Follow( A ) = { $ , ) }
非终结符号 | 输入符号 | |||||
---|---|---|---|---|---|---|
( | ) | , | a | $ | ||
S | S -> (L) | S -> a | ||||
L | L -> SA | L -> SA | ||||
A | A -> ε | A -> ,SA | A -> ε |
知识点(预测分析表)
p147 4.4.2
修改练习4.2.1 中的文法,给出该文法预测分析表
4.2.1 的文法:S→S S + | S S * | a
Answer
step1. 提取左公因子
S -> SSA | a
A -> + | *
step2. 消除左递归
排列为S A
i = 1 (j=1,内层for循环不执行,之后消除S的立即左递归)
S -> aB
B -> SAB | ε
A -> + | *
i = 2
j = 1(将形如B->Sγ 的产生式替换)
S -> aB
B -> aBAB | ε
A -> + | *
step3. 预测分析表
非终结符号 | 输入符号 | |||
---|---|---|---|---|
+ | * | a | $ | |
S | S -> aB | |||
A | A -> + | A -> * | ||
B | B -> ε | B -> ε | B -> aBAB | B -> ε |
知识点
- 对LL(1)文法:提取左公因子,消除左递归
- 自顶向下的语法分析技术不能处理左递归的情况,因此需要消除左递归,但是自底向上的技术可以处理左递归。即LL(1)需要以上两个步骤,而LR(0),SLR,LR(1),LALR不需要
p147 4.4.3
计算练习4.2.1 的文法的 FIRST 和FOLLOW 集合。
4.2.1 的文法:S→S S + | S S * | a
Answer
First( S ) = { a }
Follow( S ) = { a , + ,* }
知识点
- First集:可以包含ε
- Follow集:起始符号的Follow集为{ $ }
p147 4.4.5
文法S->aSa | aa 生成了所有由 a 组成的、长度为偶数的串。我们可以为这个文法设计一个带回溯的递归下降分析器。如果我们选择先用产生式 S->aa 展开,那么我们只能识别到串aa。因此,任何合理的递归下降分析器将首先尝试S->aSa。
- 说明这个递归下降分析器识别输入 aa,aaaa 和aaaaaaaa,但是识别不了 aaaaaa。
Answer
https://cs.stackexchange.com/questions/143480/dragon-book-exercise-4-4-5-why-is-aaaaaa-not-recognized-by-the-recursive-descen
没看懂。好像与程序有关,只能识别长度为2,4,8,16…的串
知识点
- 递归下降分析器
p153 4.5.2
对于文法S→S S + |S S * | a , 指出最右句型SS+a*a+中的句柄。
Answer
句柄=该句型最左直接短语,即 SS+
知识点
- 短语:一个句型的分析树中的每一棵子树的边缘(所有叶节点)所组成的符号串称为该句型的一个短语
- 直接短语:如果子树只有父子两代结点,那么这棵子树的边缘称为该句型的一个直接短语(即高度为2的子树的叶子节点串就是直接短语)
- 句柄:直接短语中的最左直接短语为该句型的句柄。
p153 4.5.3
对于文法S→S S + |S S * | a 和串aaa*a++, 说明自底向上语法分析的过程。
Answer
每一行填写的动作其实是下一行要真正执行的动作,即第一行填移入,实际上是在第二行执行的移入操作。
栈 | 输入 | 句柄 | 动作 |
---|---|---|---|
$ | aaa*a++$ | 移入 | |
$a | aa*a++$ | a | 规约: S -> a |
$S | aa*a++$ | 移入 | |
$Sa | a*a++$ | a | 规约: S -> a |
$SS | a*a++$ | 移入 | |
$SSa | *a++$ | a | 规约: S -> a |
$SSS | *a++$ | 移入 | |
$SSS* | a++$ | SS* | 规约: S -> SS* |
$SS | a++$ | 移入 | |
$SSa | ++$ | a | 规约: S -> a |
$SSS | ++$ | 移入 | |
$SSS+ | +$ | SS+ | 规约: S -> SS+ |
$SS | +$ | 移入 | |
$SS+ | $ | SS+ | 规约: S -> SS+ |
$S | $ | 接受 |
知识点
p164 4.6.2
为练习 4.2.1 中的(增广)文法构造 SLR 项集。计算这些项集的 GOTO 函数。给出这个文法的语法分析表。这个文法是 SLR 的吗?
4.2.1 的文法:S→S S + | S S * | a
Answer
由于是SLR分析,是自底向上的,不需要提取左公因子和消除左递归
- 原文法:
S→S S + | S S * | a - 构造增广文法G’:
- S’→S
- S→S S +
- S→S S *
- S→a
- 构造增广文法G’的LR(0)项集规范族
- GOTO函数:
GOTO(0,S)=1
GOTO(1,S)=3
GOTO(3,S)=3 - 语法分析表
FOLLOW(S)={$,+,*,a}
该语法分析表中无冲突,所以是SLR文法
知识点
- SLR弱点:会出现移进-规约冲突,可用LR(1)解决
p164 4.6.3
根据你在练习4.6.2 中得到的语法分析表,给出处理输入 aa*a+时的各个动作。
Answer
知识点
- LR分析过程:
- 初始时状态栈为0,符号栈空
- 状态栈顶与输入串第一个符号查ACTION表,确定是移进或归约
移进:状态入状态栈,字符入符号栈
归约:状态栈和符号栈同时出栈,出栈长度相同,然后归约后新符号入符号栈,接着状态栈顶与符号栈顶查GOTO表,将查到的状态入状态栈。
p165 4.6.6
说明下面的文法是SLR(1)的,但不是LL(1)的。
S→SA | A
A→a
Answer
-
该文法不是 LL(1) 的
S -> SA
和S -> A
均能推导出以 a 开头的串,所以不是 LL(1) 的 -
该文法是 SLR(1) 的
该文法生成的语法分析表是没有冲突的
知识点
p177 4.7.1
为练习4.2.1 的文法S→S S + | S S * | a 构造
- 规范 LR 项集族。
- LALR 项集族。
Answer
答案没有变换成增广文法而且状态0的向前看符号里面不知道a怎么来的,不懂。
原文法:
S→S S + | S S * | a
- 构造增广文法G’:
- S’→S
- S→S S +
- S→S S *
- S→a
-
构造规范 LR 项集族,即LR(1):
-
LALR 项集族,即合并同心项集
上图中,I2,I4,I8为同心项集,I7,I11为同心项集,I5,I9,I12为同心项集,I6,I10,I13为同心项集。合并它们并为项集重新命名为J1,J2…J6
知识点
- 同一项集中求closure闭包时,向前看符号是First(扩展符号后面的串)
- GOTO时,向前看符号直接带过去。
- 求CLSURE闭包时,新加入的项目也要再求闭包