文章目录
参考哈工大课件
正则表达式
正则表达式(Regular Expression,RE )是一种用来描述正则语言的更紧凑的表示方法
运算的优先级:*、连接、|
正则文法与正则表达式等价
单词的识别
1. 有穷自动机 (Finite Automata)
给定输入串x,如果存在一个对应于串x的从初始状态到某个终止状态的转换序列,则称串x被该FA接收
①确定的FA (Deterministic finite automata, DFA)
M = ( S,Σ ,δ,s0,F ) 注意:Σ不包含ε,s0开始只有一个状态,F终止是一个集合
可以用转换表表示DFA
是否终态 | 状态\输入 | a | b |
---|---|---|---|
0 | 0 | ||
0 | 1 | ||
1 | 2 |
②非确定的FA (Nondeterministic finite automata, NFA)
M = ( S,Σ ,δ,s0,F )
注意:δ和DFA不同,从状态s出发,沿着标记为a的边所能到达的状态集合(可能有多个标记为a的边)
从正则表达式到自动机
是否终态 | 状态\输入 | a | b |
---|---|---|---|
0 | 0 | {0,1} | {1} |
0 | 1 | {2} | |
1 | 2 | {3} |
DFA和NFA的等价性:DFA和NFA可以识别相同的语言
- 正则文法 ⇔ 正则表达式 ⇔ FA
带有和不带有“ε-边”的NFA 的等价性
2.从正则表达式到有穷自动机
从NFA到DFA的转换
子集构造法
ε-closure ( s ) :能够从NFA的状态s开始只通过ε转换到达的NFA状态集合
ε-closure ( T ) :能够从T 中的某个NFA状态 s开始只通过ε转换到达的NFA状态集合,即Us∈T,ε-closure ( s )
move( T , a): 能够从T 中的某个状态 s出发通过标号为a的转换到达的NFA状态的集合
将状态集合相同的{AB}状态,用一个新的状态{A}表示;若状态集合中包含终止状态,则这个状态也是终止状态。