编译原理与编译构造由NFA变为DFA

最新推荐文章于 2024-07-06 23:11:48 发布

NJU_SE_WaterWan

最新推荐文章于 2024-07-06 23:11:48 发布

阅读量9.3k

点赞数 3

分类专栏：编译原理与编译构造文章标签：编译原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33230935/article/details/78209950

版权

编译原理与编译构造专栏收录该内容

21 篇文章 2 订阅

订阅专栏

本文主要来源于上课笔记

单词构造的两种方法：

正规文法

形如 $A \to aB \space A \to a$

缺点是不直观

正规表达式

采用模板，好处是直观

1) $a \in RE$ ， $\epsilon$ 属于特殊字符， $\epsilon \in RE$

2) $if \space \alpha , \beta \space is \space RE,\space \alpha \cdot \beta, \alpha |\beta, \alpha^* \space are \space REs$

例： $\omega \in (a, b)^*$ ，且倒数第3个是 $a$ :

$(a|b)^*a(a|b)(a|b)$

词法分析： $RE \Rightarrow FA \Rightarrow$ 词法分析程序

FA: 状态数目有限，是一个有始有终的过程模型

FA的组成： $S, \Sigma, s_0, F, move$

$S$ 表示状态集， $\Sigma$ 表示字母表， $s_0$ 表示开始状态， $F$ 表示结束状态集/终止状态集， $move$ 表示映射

其中， $s_0 \in S, F \subseteq S$

若 $move$ 是 $n:1 / 1:1$ ，则是一个 $function$ ，则FA为DFA，否则FA为NFA

由NFA变为DFA

$N_{cases}$ :

存在 $\epsilon-$ 边
有多个后继状态

1. NFA到DFA1

Markdown

Markdown

第3张图是一个 $\epsilon -$ 闭包

2. Markdown

此时是一个子集构造

Markdown

$I_0 = \epsilon -c(\{x\})$

$I_0' = \{x\}$

$I_0'' = I_0' \bigcup \{5\} = \{x, 5\}$

$I_0''' = I_0'' \bigcup \{1\} = \{x,5,1\}$

$I_0'''' = I_0''' \bigcup \emptyset = I_0'''$

此时迭代完成，知 $I_0 = \{x,5,1\}$

我们规定初始状态是 $I_0$ ，然后这个状态是要算出来的，因为要算闭包

Markdown

$I_0 \to I_1$ 见上图

由于 $\{5, 3, 1\}$ 这个状态不存在，我们命名为 $I_1$

最终所有的状态都应该由上面 $\epsilon$ 闭包或子集构造得到。

Markdown

结论1：最多情况下由 $2^n-1$ 种状态，其中 $n$ 是一开始图中圈出来的 $x,1,2,3,4,5,6,y$ 的个数。减去的一个是空集。

结论2：核相同，则 $\epsilon - c$ 相同

$if \space \{y\} \bigcap I_i \neq \emptyset$ , 则 $I_i$ 是一个终态。在此题中， $F = \{I_3, I_4, I_5, I_6\}$

对DFA进行优化

总的思想是，减少状态数。使用的方法是，等价类划分，使用聚类的思想。

Division:

clustering(聚类)——自下而上
classifying(分类)——自上而下

在这里我们需要将 $I_i$ 以终态、非终态划分

$state \space equivalence$ :

发出的边数相同
对应的标记相同（就是箭头上面的标记）
对应的后继状态等价

易见这是一个递归定义。

若两个状态相同，则两个状态等价（强等价）。

若后继状态相同，则两个状态等价（强等价）。

若后继状态属于同一个已存在的叶节点，则弱等价。

Markdown

由一开始的初始态和终态，得出上图。

Markdown

由于 $I_0 \mathop{ \to} \limits^a I_1, I_1 \mathop{ \to} \limits^a I_3, I_2 \mathop{ \to} \limits^a I_1$

此时可见 $I_1$ 在左边， $I_3$ 在右边，因此将 $I_0,I_2$ 划分到左边， $I_1$ 划分到右边，得到上图。

Markdown

同理，由b得到上图。

在每个叶节点中选一个节点，在最右边的叶节点中选 $I_3$

Markdown

此时整个图已经变成了这样。这也叫做 $the \space minimized \space DFA$

$RE \Rightarrow NFA \Rightarrow DFA \Rightarrow DFA^o \Rightarrow program$

$DFA^o$ 表示优化过的 $DFA$

注意，需要用到 $look \space back$ 来检查是否之前的后继状态在同一节点而之后的后继状态不在同一节点的情况。

如下例子：

Markdown

Markdown

Markdown

过程略一下。

RE转NFA的方法

方法1：

一些RE转NFA的规则(人喜欢的方法，也是考试时用的方法)：

Markdown

Markdown

Markdown

方法2：

方法2是龙书上的算法，笔记上有，由于考试不考，实验要用，因此现在先不管。以后再说。

一个词法分析程序分析所有单词。

NJU_SE_WaterWan

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。