编译原理Compiler-ch07- LL(1) 语法分析器

αSIM0V

已于 2023-04-23 15:10:39 修改

阅读量1.2k

点赞数

文章标签： java 软件工程

于 2023-04-23 15:10:17 首次发布

本文链接：https://blog.csdn.net/C15062835505/article/details/130322069

版权

编译原理专栏收录该内容

11 篇文章 1 订阅

订阅专栏

Compiler-ch07- LL(1) 语法分析器

LL(1) 语法分析器

构建语法分析树: 自顶向下 vs. 自底向上

只考虑无二义性的文法这意味着, 每个句子对应唯一的一棵语法分析树

自顶向下的、递归下降的、基于预测分析表的、适用于LL(1) 文法的、 LL(1) 语法分析器

自顶向下构建语法分析树

根节点是文法的起始符号 S
每个中间节点表示对某个非终结符应用某个产生式进行推导 (Q : 选择哪个非终结符, 以及选择哪个产生式)
在推导的每一步, LL(1) 总是选择最左边的非终结符进行展开
LL(1): 从左向右读入词法单元
叶节点是词法单元流 w$ 仅包含终结符号与特殊的文件结束符 $ (EOF)

递归下降

在这里插入图片描述

递归下降是LL(1)语法分析器常用的实现方式

为每个非终结符写一个递归函数内部按需调用其它非终结符对应的递归函数, 下降一层

为了实现额外的任务，可以加参数和返回值

实现过程

先选择一个A的产生式，1-k
for循环处理每个X₁ ~ X _k
X为非终结符，调用X对应的递归函数
X为终结符
- X_i=a 匹配上当前的词法单元
- X_i！=a 出现错误

优缺点

优点

算法简单

缺点

能处理文法（上下文无关文法）的种类很少

如果不能处理，改造文法复杂

演示递归下降过程

在这里插入图片描述

每次都选择语法分析树最左边的非终结符进行展开

同样是展开非终结符 S, 为什么前两次选择了 S → (S + F), 而第三次选择了 S → F?

因为它们面对的当前词法单元不同

使用预测分析表确定产生式

在这里插入图片描述

指明了每个非终结符在面对不同的词法单元或文件结束符时, 该选择哪个产生式 (按编号进行索引) 或者报错 (空单元格)

只有第二条会产生小括号，如果读入字符是（，就只能选第二条
第三次是F，面对的读入字符是a，所以只会选择3

LL(1) 文法Definition ：

如果文法 G 的预测分析表是无冲突的, 则 G 是 LL(1) 文法。

无冲突: 每个单元格里只有一个产生式 (编号)

对于当前选择的非终结符, 仅根据输入中当前的词法单元 (LL(1)) 即可确定需要使用哪条产生式

递归下降的、预测分析实现方法

框架：

假定预测分析表已经被构建出来了

procedure match(t)
 if token = t then
 token ← next-token()
 else
 error(token, t)
     
procedure S()
 if token = ‘(’ then
 match(‘(’)
 S()
 match(‘+’)
 F()
 match(‘)’)
 else if token = ‘a’ then
 F()
 else
 error(token, {‘(’, ‘a’})

procedure F()
 if token = ‘a’ then
 match(‘a’)
 else
 error(token, {‘a’})

计算给定文法 G 的预测分析表

在这里插入图片描述

选择decl展开因为只有这样才能在后面产生int
选择func_call是因为只有这样才能产生ID这个终结符

在这里插入图片描述

什么时候选择非终结符的ε产生式

只有在这个非终结符的后面的这个终结符可能是我想要的终结符的情况下，才可以选择将其变无

如果有一个终结符，而且这个终结符有一个产生式，变成ε，或者经过很多步推导可以生成ε，后面的非终结符使我们接下来要匹配的终结符，接下来要匹配的终结符最好就是当前指针要指向的终结符

要看这个非终结符有哪些终结符跟在后面

First(α) 集合 Definition

First(α) 是可从 α 推导得到的句型的首终结符号的集合

对于任意的 (产生式的右部) α ∈ (N ∪ T) ∗ :

First(α) = { t ∈ T ∪ {ϵ} | α ∗=⇒ tβ ∨ α ∗=⇒ ϵ } . （*==>指经过任意步推导）β是任意非终结符和终结符的集合，可能为空

考虑非终结符 A 的所有产生式 A → α1, A → α2, . . . , A → αm, 如果它们对应的 First(αi) 集合互不相交, 则只需查看当前输入词法单元, 即可确定选择哪个产生式 (或报错)

例：

First(prog) = {‘int’, ID}

First是想知道，如果选择了某种特定的展开方式，会产生哪些首终结符，有没有可能是指针指向的字符

Follow(A) 集合 Definition

Follow(A) 是可能在某些句型中紧跟在 A 右边的终结符的集合

对于任意的 (产生式的左部) 非终结符 A ∈ N :

Follow(A) = { t ∈ T ∪ {$} | ∃s. S ∗=⇒ s ≜ βAtγ } .

β和γ是任意非终结符和终结符的集合，可能为空

如果退出来A这个非终结符，而且后面是终结符，t ∈ Follow(A)， t有可能是$（s是开始符号，而$是输入右端的结束标记）

考虑产生式 A → α, 如果从 α 可能推导出空串 (α ∗=⇒ ϵ), 则只有当当前词法单元 t ∈ Follow(A), 才可以选择该产生式(意味着A会消失)

计算算法

先计算每个符号 X 的 First(X) 集合

procedure first(X)
 if X ∈ T then ▷ 规则 1: X 是终结符
 	First(X) = X
 for X → Y1Y2 . . . Yk do ▷ 规则 2: X 是非终结符
     //Y的首终结符包含于X的首终结符
     //Y如果变成ε不代表X也会变成ε
 	First(X) ← First(X) ∪ {First(Y1) \ {ϵ}}  
 	for i ← 2 to k do
        //看ε能不能由Y1推出来
 		if ϵ ∈ L(Y1 . . . Yi−1) then
 			First(X) ← First(X) ∪ {First(Yi) \ {ϵ}}
	//看完1~k
	//L(Y1 . . . Yk)表示Y1~Yk都能退出ε
 	if ϵ ∈ L(Y1 . . . Yk) then ▷ 规则 3: X 可推导出空串
 		First(X) ← First(X) ∪ {ϵ}

不断应用上面的规则, 直到每个 First(X) 都不再变化 (不动点!!!)

再计算每个符号串 α 的 First(α)

在这里插入图片描述

例子

在这里插入图片描述

为每个非终结符 X 计算 Follow(X) 集合

 procedure follow(X)
 	for X 是开始符号 do ▷ 规则 1: X 是开始符号
 		Follow(X) ← Follow(X) ∪ {$}
 	for A → αX do ▷ 规则 2: X 是某产生式右部的最后一个符号
        //所有能跟在A后的终结符都可能跟在S后面
 		Follow(X) ← Follow(X) ∪ Follow(A)
 	for A → αXβ do ▷ 规则 3: X 是某产生式右部中间的一个符号、
        //X是某个产生式中间的符号
        //β能推出来的终结符一定能跟在X后面
        //ε不一定在X后面
 		Follow(X) ← Follow(X) ∪ (First(β) \ {ϵ})
 		if ϵ ∈ First(β) then
			 Follow(X) ← Follow(X) ∪ Follow(A)