文章目录
语言 L = { a } { a , b } ∗ ( { ϵ } ∪ ( { . , _ } { a , b } { a , b } ∗ ) ) L=\{a\}\{a,b\}^*(\{\epsilon \} \cup (\{.,\_\}\{a,b\}\{a,b\}^*)) L={ a}{ a,b}∗({ ϵ}∪({ .,_}{ a,b}{ a,b}∗))
这个语言是指,由a
开头,后接任意长度的a、b
串,然后再接空串(代表结束)。或者是接以.
或_
开头的,后接长度大于等于1的a、b
串。
正则表达式(Regular Expression, RE)是一种用来描述正则语言的更紧凑的表示方法。
以上面的语言举例,写成正则表达式则可表示成: r = a ( a ∣ b ) ∗ ( ϵ ∣ ( . ∣ ) ( a ∣ b ) ( a ∣ b ) ∗ ) r=a(a|b)^*(\epsilon | (.|_)(a|b)(a|b)^*) r=a(a∣b)∗(ϵ∣(.∣)(a∣b)(a∣b)∗)
正则表达式可以由较小的正则表达式按照特定规则递归地构建。每个正则表达式r
定义一个语言。记为L(r)
。这个语言也是根据r
的子表达式所表示的语言递归定义的。
定义
- 如果 ϵ \epsilon ϵ是一个RE, L ( ϵ ) = { ϵ } L(\epsilon) = \{\epsilon\} L(ϵ)={ ϵ}
- 如果 α ∈ ∑ \alpha \in \sum α∈∑