编译原理——DFA与NFA及子集法将DFA转换成NFA

最新推荐文章于 2024-07-06 23:11:48 发布

SWEENEY_HE

最新推荐文章于 2024-07-06 23:11:48 发布

阅读量5.6k

点赞数 2

分类专栏：编译原理

本文链接：https://blog.csdn.net/SWEENEY_HE/article/details/102979893

版权

编译原理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. DFA与NFA的定义

(1) 概述

有穷自动机又称有限自动机，是识别正规文法的语言以及其所表示的集合，包括
DFA(Deterministic Finite Automata)确定的有穷自动机和NFA(Nondeterministic Finite Automata)不确定的有穷自动机。

(2) DFA

一个确定的有穷自动机M是一个五元组：

$\sum,f,S,Z)$

(1) $K$ 是一个有穷集，它的每个元素称为一个状态

(2) $\sum$ 是一个有穷字母表，它的每个元素称为一个输入符号，所以也称其为输入符号表

(3) $f$ 是转换函数，是 $\times\sum \to K$ 上的映像。例如 $f(k_{i},a)=k_{j}(k_{i},k_{j}\in K) 表示在状态k_{i}输入一个字符a即转换到状态k_{j}$

(4)S $\in K$ 是唯一的初态

(5)Z $\in K$ 是唯一的终态

一个DFA可表示成状态图
在这里插入图片描述

(3) NFA

一个不确定的有穷自动机 $M$ 是一个五元组：

$(K,\sum,f,S,Z)$

(1) $K$ 是一个有穷集，它的每个元素称为一个状态

(2) $\sum$ 是一个有穷字母表,它的每个元素称为一个输入符号

(3) $f$ 是转换函数，是 $\times\sum^* \to 2^k$ 上的映像,其中 $2^k$ 表示 $K$ 的幂集( $\sum^*=\sum^0\cup\sum^1\cup\dots\cup\sum^n其中\sum^0=\varepsilon,\varepsilon是空串$ )

(4) $S\in K$ ，是一个非空初态集

(5) $Z\in K$ ，是一个非空终态集

一个NFA也可表示成状态图
在这里插入图片描述

2. NFA转换成等价的DFA——子集法

(1) 依据：

设L为一个NFA接受的集合，则存在一个接受L的DFA

(2) 子集法：

首先定义两个运算：
1> $\varepsilon-closure(I)$ ： $\varepsilon闭包,状态集I中的任意状态S经任意条\varepsilon弧能够到达的状态的集合$
2> $m o v e (I, a) : 状态集合 I 的 a 弧转换，指状态集合 I 中任意状态能经过一个 a 弧到达的状态的全体$

思路：

DFA的每个转换都是确定的，而NFA中包含空串 $\varepsilon$ ,导致了它不确定。我们要做的就是合并空串 $\varepsilon$ 所导致的的等价状态从而消除空串。所谓等价状态即能通过若干个 $\varepsilon$ 连接的状态。如下图所示，状态0经过一条 $\varepsilon$ 到达状态1，经过两条 $\varepsilon$ 到达状态2，因此{0,1,2}等价,最后会合并成一个状态。而求某个状态 $t$ 的等价状态就是在做 $\varepsilon-closure(t)$ 运算。注意：由于NFA中每个状态允许存在多条 $\varepsilon$ 出弧，且可能之间还存在非 $\varepsilon$ 弧。因此，NFA中的每个状态会重复出现在多个等价状态中。不容易直接通过求等价状态(结点)来求DFA
在这里插入图片描述
我们知道，由弧连接的两个结点都是状态，可以看作图。对于图的构建来说，只需找出一个结点然后通过它的出弧找到其他结点(这个过程即 $move(K,\sum)$ 运算),并对这些结点递归处理即可找到所有的结点，类似于图的广搜。对于NFA来说，我们可以先求出初始状态的等价状态 $\varepsilon-closure(S)$ 即第一个结点,然后通过它的出弧来找到其他状态，从而构建DFA。

第一步：求初始状态的等价状态 $T_{0} = \varepsilon-closure(S)$

第二步: 找到 $T_{0}$ 中所有出弧以及对应的状态(以下仅以出弧a为例) $move(T_{0},a) (a\in \sum)$ 。由于 $T_{0}$ 存在一条出弧a到达Temp，因此Temp必须作为一个状态。根据等价思想，可令 $T_{1} = \varepsilon-closure(Temp)$ ,即Temp的等价状态 $T_{1}$ 是NFA中新的状态 $T_{0}与T_{1}之间的映射关系为D([T_{0}],a) = T_{1}$

第三步：将求出的新状态再重复步骤二。直到得到的状态均已存在。

最终得到新状态： $T_{0}、T_{1}、T_{2}、T_{3}\dots T_{n}$ 以及之间的映射关系 $D([T_{0}],a) = T_{1}、D([T_{0}],b) = T_{2}、D([T_{2}],a) = T_{3}、\dots D([T_{n}],a) = T_{n}$