正规式到nfa dfa java_正规式与正规集,DFA与NFA

本文探讨了词法分析器的设计,其中正规式和正规集用于描述程序设计语言的单词规范。介绍了正规式和正规集的概念,如ε和∅的含义,以及如何通过结合、连接和闭包操作构造正规式。讨论了确定有限自动机(DFA)和非确定有限自动机(NFA),解释了它们的状态转换图,并指出尽管NFA允许多个初始状态和ε迁移,但其识别能力与DFA相同。
摘要由CSDN通过智能技术生成

词法分析器的设计

词法分析器的功能:输入源程序、输出单词符号

词法分析器的设计:给出程序设计语言的单词规范——单词表, 对照单词表设计识别该语言所有单词的状态转换图, 根据状态转换图编写词法分析程序

字母表:一个有穷字符集,记为∑

字母表中每个元素称为字符

∑上的字(也叫字符串) 是指由∑中的字符所构成的一个有穷序列

不包含任何字符的序列称为空字,记为ε

用∑*表示∑上的所有字的全体,包含空字ε

例如: 设 ∑={a, b},则,∑*={ε,a,b,aa,ab,ba,bb,aaa,...}

∑ * 的子集U和V的连接(积)定义为UV={ αβ | α∈U & β∈V }

V自身的 n次积记为V n =V V…V

56e38de524ac6227d7a59f6ca1245440.png

正规式和正规集

程序设计语言的单词符号都是一些特殊的字符串,用正规集和正规表达式(简称正规式)来描述

正规集可以用正规式表示,正规式是表示正规集一种方法, 一个字集合是正规集当且仅当它能用正规式表示

正规式和正规集的递归定义

对给定的字母表Σ,ε 和∅都是Σ上的正规式,它们所表示的正规集为{ε}和∅;

任何a∈Σ ,a是Σ上的正规式,它所表示的正规集为{a} ;

ε是什么?字,正规式

∅是什么?集合,正规式

a (a ∈Σ)是什么?字符,字,正规式

假定e 1 和e 2 都是Σ上的正规式,它们所表示的正规集为L(e 1 )和L(e 2 ),则(e 1 |e 2 )为正规式,它所表示的正规集为L(e 1 )∪L(e 2 ),(e 1 .e 2 )为正规式,它所表示的正规集为L(e 1 )L(e 2 ),(e 1 ) * 为正规式,它所表示的正规集为(L(e 1 )) *,仅由有限次使用上述三步骤而定义的表达式才是Σ上的正规式,仅由这些正规式表示的字集才是Σ上的正规集。

正规式的等价性

若两个正规式所表示的正规集相同,则称这两个正规式等价。如

280e4d7f5ee9a668ec9ca370166f9aa1.png

正规式的性质

42bf8a284f968c6cafb83ae0726c5cb0.png

b46dab71d9b2a3c181312527ca3d771b.png

确定有限自动机

对状态图进行形式化定义

78a8c0b05ae37b69eebfdc1d0f3318ab.png

05ec5be8bc199d256d7e324fc350f1b8.png

DFA表示为状态转换图,假定DFA M含有m个状态和n个输入字符,对应的状态转换图含有m个状态结点,每个结点顶多含有n条箭弧射出,且每条箭弧用Σ上的不同的输入字符来作标记

对于Σ*中的任何字α,若存在一条从初态到某一终态的道路,且这条路上所有弧上的标记符连接成的字等于α,则称α为DFA M所识别(接收),DFA M所识别的字的全体记为L(M)

c8d10096fadd22d94fa94f44261ef92e.png

L(M)={含aa或bb的字}

fcd91904ec945f953d7466f938a3e2e0.png

非确定有限自动机

181bf7afa486f33bbcf4a860ef7b0acf.png

bbc26156063dfb9f1e0fa82fcd612078.png

从状态图看NFA 和DFA的区别,NFA可以有多个初态,弧上的标记可以是Σ * 中的一个字(甚至可以是一个正规式),而不一定是单个字符,同一个字可能出现在同状态射出的多条弧上

DFA是NFA的特例

对于Σ*中的任何字α,若存在一条从初态到某一终态的道路,且这条路上所有弧上的标记字连接成的字等于α(忽略那些标记为ε的弧),则称α为NFA M所识别(接收),NFA M所识别的字的全体记为L(M)

7e31fbdb528cdf6dc96e752db4ebeb73.png

L(M 1 )={含aa或bb的字}

aaeee1d55277f84ed849e856461ea864.png

L(M 2 )={a m b n | m,n≥1}

4dac9d525f66dd67e4e274d0a10f9d19.png

DFA和NFA

定义:对于任何两个有限自动机M和M’,如果L(M)=L(M’),则称M与M’等价,自动机理论中一个重要的结论:判定两个自动机等价性的算法是存在的,对于每个NFA M存在一个DFA M’,使得L(M)=L(M’),DFA与NFA识别能力相同!

ac35001dd0b2ad0edb4ca8b73db80b51.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值