形式语言与自动机第3章有穷自动机和正规表达式

Air浩瀚

于 2022-06-30 22:43:10 发布

阅读量540

点赞数 1

分类专栏： # 形式语言与自动机文章标签：其他

本文链接：https://blog.csdn.net/Ryansior/article/details/125549687

版权

形式语言与自动机专栏收录该内容

8 篇文章 5 订阅

订阅专栏

文章目录

第3章有穷自动机和正规表达式

第3章有穷自动机和正规表达式

有穷自动机

DFA

确定的有穷自动机（DFA）是个五元组： $M=(Q,\Sigma,\delta,q_0,F)$ ，其中：

$Q$ 是有穷状态集
$\Sigma$ 是有穷的输入字母表
$\delta$ 是转移函数， $\delta:\, Q\times\Sigma\to Q$
$q_0\,\in\, Q$ ，是初始状态
$F\,\subseteq\,Q$ ，是终结状态集

转移函数定义拓展：
$\left \{ \begin{array}{ll} \hat{\delta}(q,\varepsilon)=q\\ \hat{\delta}(q,wa)=\delta(\hat{\delta}(q,w),a) \end{array} \right.$
其中 $w$ 是字符串， $w\in{\Sigma}^{\ast}$

NFA

定义与 DFA 类似，不同之处在于转移函数 $\delta:\, Q\times\Sigma\to 2^Q$ ，即下一状态是个集合；只要有一条分支到达 $F$ 就算接受

转移函数定义拓展：
$\left \{ \begin{array}{ll} \hat{\delta}(q,\varepsilon)=\{q\}\\ \hat{\delta}(q,wa)=\{p|p\,\in\,\delta(r,a)\, ,r\,\in\,\hat{\delta}(q,w)\} \end{array} \right.$
其中 $w$ 是字符串， $w\in{\Sigma}^{\ast}$

$\varepsilon$ -NFA

定义与 NFA 类似，不同之处在于转移函数还可以接受空串/空字符 $\varepsilon$

转移函数定义拓展：
$\left \{ \begin{array}{ll} \hat{\delta}(q,\varepsilon)={\varepsilon}-CLOSURE(q)\\ \hat{\delta}(q,wa)={\varepsilon}-CLOSURE(P),{\,}P={\cup}_{r\,\in\,\hat{\delta}(q,w)}{\delta}(r,a) \end{array} \right.$
其中 $\varepsilon -CLOSURE(q)$ 定义为：

$q$ 在 $\varepsilon -CLOSURE(q)$ 中
若 $p$ 在 $\varepsilon -CLOSURE(q)$ 中，则 $\delta(p,{\varepsilon})$ 也在 $\varepsilon -CLOSURE(q)$ 中
重复以上步骤，直至 $\varepsilon -CLOSURE(q)$ 不再增加为止

（可以理解成从状态 $q$ 出发，仅通过接受 $\varepsilon$ 可以到达的状态集）

结构图

fct-3-8

NFA $\to$ DFA

算法描述

算法：将状态的集合看作状态（状态会发生改变）；从起始状态开始，逐一尝试字母表中每个字母，获得下一状态；对于新增加的状态，重复上述过程，直到不再有新的状态产生；

例题

例：将如图所示的 NFA 转化为相应的 DFA，转移函数：

$\delta(q_0,0)=\{q_0,q_3\}$ $\delta(q_0,1)=\{q_0,q_1\}$

$\delta(q_1,0)=\varnothing$ $\delta(q_1,1)=\{q_2\}$

$\delta(q_2,0)=\{q_2\}$ $\delta(q_2,1)=\{q_2\}$

$\delta(q_3,0)=\{q_4\}$ $\delta(q_3,1)=\varnothing$

$\delta(q_4,0)=\{q_4\}$ $\delta(q_4,1)=\{q_4\}$

过程：

$\varepsilon$ -NFA $\to$ NFA

算法描述

算法：

① 状态并不改变，转移路径去除了接受 $\varepsilon$ 的路径；

② 增加了另外许多路径，增加规则如下：

对于 $\delta(q,a)=P$ ，则增加路径 $q\overset{a}{\to}{\varepsilon}-CLOSURE(P)$ ；
对于 $Q\subseteq{\varepsilon}-CLOSURE(q)$ 且 $Q\overset{a}{\to}P$ ，增加路径 $q\overset{a}{\to}P$ ；

（即需要增加：① 能够通过 $q$ 的闭包到达的状态；② $q$ 能够到达状态的闭包）

③ 处理终结状态：
$F'=\left \{ \begin{array}{ll} F{\cup}\{q_0\},{\quad}if{\,}{\,}{\,}{\,}{\varepsilon}-CLOSURE(q_0){\cap}F{\not=}{\varnothing}\\ F,{\quad}{\quad}{\quad}{\,}{\,}{\,}else \end{array} \right.$
（就是说，如果原来从起始状态出发，不接受任何字符就可以到达终结状态，那么起始状态事实上也是终结状态）

例题

例：将如图所示的 $\varepsilon$ -NFA 转化为 NFA：

转化前	转化后

RL $\to\varepsilon$ -NFA

算法描述

算法：将基础和正则表达式的三种运算用不同的 $\varepsilon$ -NFA 处理：

基础	或

连接	闭包

例题

例：将 10*+0 构造成一个 NFA

DFA $\to$ RL

算法描述

算法：将 DFA 中所有状态标上序号，引入记号 $R^k_{ij}$ ，其含义是从序号为 $i$ 到序号为 $j$ 的状态的路径中所经过状态序号不大于 $k$ （不包括 $i$ 、 $j$ 本身）的字符串集合，递推公式为：
$R^0_{ij}=\left \{ \begin{array}{ll} \{a|{\delta}(q_i,a=q_j)\},{\quad}{\quad}{\quad}if{\,}{\,}{\,}{\,}i{\not}=j\\ \{a|{\delta}(q_i,a=q_j)\}{\cup}\{ {\varepsilon}\},{\quad}if{\,}{\,}{\,}{\,}i=j \end{array} \right.\\$

$R^k_{ij}=R^{k-1}_{ik}(R^{k-1}_{kk})^{\ast}R^{k-1}_{kj}{\,}{\cup}{\,}R^{k-1}_{ij}$

递推公式第二条第一部分的意思是，如果有经过状态序号为 $k$ 的状态，则将这部分拆分开来

（具体用表格实现， $k = 0$ 的情况直接根据 DFA 的转移路径写出；若有 $n$ 个状态，则 $k = n$ 的情况不要全部写出来，而是只写出 $q_j{\,}{\in}{\,}F$ 的情况）

例题

例：给定如图 DFA，写出代表该自动机所接受的语言集合的正规表达式：

表格：

最后 $q_2$ 和 $q_3$ 是终结状态，因此只需求出：

$r^3_{12}=r^2_{13}(r^2_{33}){\ast}r^2_{32}+r^2_{12}=0^{\ast}1((0+1)0^{\ast}1)^{\ast}(0+1)(00)^{\ast}+0(00)^{\ast}$
$r^3_{13}=r^2_{13}(r^2_{33}){\ast}r^2_{33}+r^2_{13}=0^{\ast}1((0+1)0^{\ast}1)^{\ast}$