编译原理-词法分析


参考哈工大课件

正则表达式

正则表达式(Regular Expression,RE )是一种用来描述正则语言的更紧凑的表示方法
运算的优先级:*、连接、|
正则文法与正则表达式等价

单词的识别

1. 有穷自动机 (Finite Automata)

给定输入串x,如果存在一个对应于串x的从初始状态到某个终止状态的转换序列,则称串x被该FA接收

①确定的FA (Deterministic finite automata, DFA)

M = ( S,Σ ,δ,s0,F ) 注意:Σ不包含ε,s0开始只有一个状态,F终止是一个集合
可以用转换表表示DFA

是否终态状态\输入ab
00
01
12

②非确定的FA (Nondeterministic finite automata, NFA)

M = ( S,Σ ,δ,s0,F )
注意:δ和DFA不同,从状态s出发,沿着标记为a的边所能到达的状态集合(可能有多个标记为a的边)
从正则表达式到自动机

是否终态状态\输入ab
00{0,1}{1}
01{2}
12{3}

DFA和NFA的等价性:DFA和NFA可以识别相同的语言

  • 正则文法 ⇔ 正则表达式 ⇔ FA

带有和不带有“ε-边”的NFA 的等价性

2.从正则表达式到有穷自动机

在这里插入图片描述

从NFA到DFA的转换

子集构造法
ε-closure ( s ) :能够从NFA的状态s开始只通过ε转换到达的NFA状态集合
ε-closure ( T ) :能够从T 中的某个NFA状态 s开始只通过ε转换到达的NFA状态集合,即Us∈T,ε-closure ( s )
move( T , a): 能够从T 中的某个状态 s出发通过标号为a的转换到达的NFA状态的集合
将状态集合相同的{AB}状态,用一个新的状态{A}表示;若状态集合中包含终止状态,则这个状态也是终止状态。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值