一、正则式(regular expression)
1.正则式定义:
ε表示语言{ ε},a表示语言{a},(r)|(s)表示语言L(r)并L(s),(r)(s)表示语言L(r)L(s),(r)*表示语言(L(r))*
正则式优先级为 闭包>连接>或,即((a)(b)*)|(c)写为ab*|c 。
再给一些例子:(a|b)(a|b)定义的语言为{aa,ab,ba,bb},(a|b)*定义为由a和b表示的所有串集。
2.C语言标识符的正则定义:
letter_ → A|B|...|Z|a|b|...|z|_
digit → 0|1|...|9
id → letter_(letter_ | digit)*
3.正则式和上下文无关文法比较:
任何正则式都可写出上下文无关文法(更准确地说为正规文法,即3型文法)。
如正则式 (a|b)*ab 一定能给出