day07_编译原理学习

礼拜五&

于 2024-09-16 17:22:41 发布

阅读量644

点赞数 27

文章标签：学习

本文链接：https://blog.csdn.net/m0_74985290/article/details/142289290

版权

第四章语法分析

右部某位置标有圆点的产生式称为相应文法的一个LR(0)项目（简称为项目） $A\rightarrow \alpha_{1}\cdot \alpha_{2}$
- 项目描述了句柄识别的状态
- 产生式 $A\rightarrow \varepsilon$ 只生成一个项目 $A\rightarrow \cdot$

如果G是一个以S为开始符号的文法，则G的增广文法G‘就是在G中加上新开始符号S'和产生式S' -> S而得到的文法
- 例
- 引入这个新的开始产生式的目的是使得文法开始符号仅出现在一个产生式的左边，从而使得分析器只有一个接受状态
文法中的项目
- 后继项目
  - 同属于一个产生式的项目，但圆点的位置只相差一个符号，则称后者是前者的后继项目
  - $A\rightarrow \alpha \cdot X\beta$ 的后继项目是 $A\rightarrow \alpha X\cdot \beta$
- “等价”项目
  - 当一个项目中圆点位置后面是一个非终结符时，可能存在“等价”项目
  - 可以把所有等价的项目组成一个项目集 $(I)$ ，称为项目集闭包，每个项目集闭包对应着自动机的一个状态

CLOSURE()函数
- 计算给定项目集I的闭包
GOTO()函数
- 返回项目集I对应于文法符号X的后继项目集闭包
构造LR(0)自动机的状态集
- 规范LR(0)项目族（Canonical LR(0) Collection）
LR(0)分析表构造算法
LR(0)自动机的形式化定义
- 文法
- LR(0) 自动机
LR(0)分析过程中的冲突
- 表达式文法的LR(0)分析表含有移进/归约冲突
- 还有一种冲突——归约/归约冲突
- 如果LR(0)分析表中没有语法分析动作冲突，那么给定的文法就称为LR(0)文法
- 不是所有CFG都能用LR(0)方法进行分析，也就是说，CFG不总是LR(0)文法

SLR只是简单地考察下一个输入符号b是否属于与归约项目 $A\rightarrow \alpha$ 相关联的 $FOLLOW(A)$ ，但是 $b\in FOLLOW(A)$ 只是归约 $\alpha$ 的一个必要条件，而非充分条件（只是合理，但是并不一定正确）
对于产生式 $A\rightarrow \alpha$ 的归约，在不同的使用位置，A会要求不同的后继符号
在特定位置，A的后继符集合是 $FOLLOW(A)$ 的子集

将一般形式为 $[A\rightarrow \alpha \cdot \beta ,a]$ 的项称为LR(1)项，其中 $A\rightarrow \alpha \cdot \beta$ 是一个产生式，a是一个终结符（这里将$视作一个特殊的终结符），表示在当前状态下，A后面必须紧跟终结符，称为该项的展望符(lookahead)
- LR(1)中的1指的是项的第二个分量的长度
- 在形如 $[A\rightarrow \alpha \cdot \beta ,a]$ 且 $\beta \neq \varepsilon$ 的项中，展望符a没有任何作用
- 但是一个形如 $[A\rightarrow \alpha \cdot ,a]$ 的项在只有在下一个输入符号等于a时才可以按照 $A\rightarrow \alpha$ 进行归约
  - 这样的a的集合总是 $FOLLOW(A)$ 的子集，而且它通常是一个真子集

如果除了展望符外，两个LR(1)项目集是相同的，则称这两个LR(1)项目集是同心的

寻找具有相同核心的LR(1)项集，并将这些项集合并为一个项集。所谓项集的核心就是其第一分量的集合
然后根据合并后得到的项集族构造语法分析表
如果分析表中没有语法分析动作冲突，给定的文法就称为LALR(1)文法，就可以根据该分析表进行语法分析
- 合并同心项集不会产生移进-归约冲突
- 合并同心项集后，虽然不会产生冲突，但可能会推迟错误的发现。LALR分析法可能会做多余的归约动作，但绝不会作错误的移进操作