四.正则表达式转换为有限状态自动机:DFA 最小化

原文:https://study.163.com/course/courseMain.htm?courseId=1002830012
在这里插入图片描述
从上图看,节点,4,6,7完全可以合并成一个节点。或者说,我们可以把节点4,6去掉而不影响状态机的功能。本节我们的目的就是讨论如何实现DFA的优化功能。

DFA最小化算法描述:
1.把所有状态节点分成两分区,接收状态为一分区,非接收状态为一分区:
在这里插入图片描述
节点0,1,2,5是非接收节点,他们统一放入一个分区,分区编号0.
节点3, 4, 6, 7 是接收节点,他们统一放入一个分区,分区标号1.

2.根据每一个状态节点对应输入字符后的跳转情况,进行下一步分区。我们先看输入字符为数字字符的情况,也就是看表中的D列,节点0,2,5对应输入为D时,他们的跳转状态为2,5,5, 这几个状态都在分区0,也就是节点0,2,5对应输入为数字字符时,任跳转到分区0,节点1输入D时,跳转到状态3,状态3在分区1,由此,状态1要从分区0中拿出来,单独成一个分区。同理对于分区1中节点,状态3,对应输入为D时,跳转到NULL, 状态4,6,7对应于输入D,跳转到节点6,7,7,节点6,7,7都在分区1,所以,此时可把状态3拿出来,单独形成一个分区,于是有:
在这里插入图片描述

转换后,节点2单独在一个分区标号为2,节点3单独一个分区编号3.

3.我们在看看输入字符为”.” 的情况,分区0中的状态点0接收字符”.”后跳转到状态1, 节点5跳转到状态1,也就是说,状态点0,5接收字符”.”后都转移到同一个分区2,状态点2接收”.”后跳转到节点4,节点4在分区1,因此,状态点2要从分区0中剥离开来,由于分区1,2,3中的状态点都不接收字符”.”所以他们不做处理,于是有下表:
在这里插入图片描述
4.基于上面分割的基础上,我们再从来一次,看看还能不能产生新的分割,对输入为D时,分区0中的状态节点0跳转到状态2,状态2在分区4,状态节点跳5跳转到状态5,状态5在分区0,因此,分区0中的两个节点0,5得分割开来:
在这里插入图片描述
5.基于上表,我们再对不同输入,各分区中的节点已经不能再分割,所以算法到此就结束了。

根据分割后的情况,我们把点和点间的转移关系,换成分区与分区的转移关系,我们得到新的DFA:

节点0在分区0,输入D后跳转到节点2,节点2在分区4,输入字符”.”,跳转到状态1,状态1在分区2,所以有:
0-(D)->4, 0-.->2

节点5在分区5,输入D后跳转到节点5,节点5在分区5,输入”.”后跳转到节点1,节点1在分区2,所以有:
5-(D)->5, 5-.->2

节点2在分区4,输入D跳转节点5,节点5在分区5,输入”.”跳转到节点4,节点4在分区1,所以有:
4-(D)->5, 4-.->1

节点1在分区2,输入D跳转到节点3,节点3在分区3,所以有:
2-(D)->3

节点4,6,7在分区1,输入D后跳转的点都在分区1,所以有:
1-(D)->1

从而我们得到的优化后的DFA:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编译原理是学习计算机科学的一门基础课程,主要涉及语言的识别和转化,而正则表达式则是其中一个非常重要的工具。在编译原理中,正则表达式通常用于描述一些模式,比如关键字、标识符等。因此,掌握正则表达式转换过程对于理解编译原理课程非常重要。 正则表达式转换过程主要包括以下几个部分:正则表达式转NFA、NFA转DFADFA最小化。其中,NFA(非确定有限状态自动机)和DFA(确定有限状态自动机)都是描述正则表达式的模型。 正则表达式转NFA: 首先,正则表达式中的基本元素是字符、括号和运算符。在转换为NFA的过程中,需要设计出一些状态来描述不同的字符和运算符。 对于字符来说,我们可以为它们设计出一个状态状态的入口边是字符,出口边为空。 对于括号和运算符来说,可以为它们设计出一些连接状态。例如在括号中的字符可以通过连接状态直接连接到后面的状态,或者通过其他运算符先连接到其他的状态再连接到后面的状态。 最后,需要定义一个起始状态和一个终止状态,起始状态与第一个字符状态相连,最后一个字符状态与终止状态相连。这样,我们就得到了一张NFA图。 NFA转DFA: 将一个NFA图转换成DFA图的主要目的是为了简化图结构,以便后续对文本进行识别。 首先,需要定义DFA状态集合,每个集合都对应一个状态。因为DFA是完全确定的有限状态自动机,所以在DFA中只能有一个状态。 然后,需要将NFA图中的每个状态都映射为DFA图中的一个状态,以便对文本进行识别。当NFA图中有多个状态对应于DFA图中的同一状态时,需要将它们合并,并将它们的出口边合并成一个出口边。 DFA最小化: 最后,对DFA进行最小化处理,以便减少状态数,提高运行效率。在最小化处理时需要考虑不同状态之间的等价关系。 可以采用遍历算法,将DFA中的状态按照等价关系划分为若干个等价类,然后构造一个等价类访问表,每个表项对应一个状态集。 最小化后的DFA图是可以识别文本的,可以用于在编译器中进行文本匹配和词法分析等操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值