正则表达式引擎

正则表达式的几种引擎:

1、DFA,确定性有穷自动机。

2、NFA,非确定性有穷自动机。


NFA,表达式主导引擎

DFA,文本主导引擎


将一个正则表达式转换成一个有穷自动状态机。

有穷自动状态机分为:确定性和非确定性。

Thompson正则构造转换开发出的将正则表达式转换成NFA的算法。

将一个正则转换成一个NFA

基本原理:

1、对于 「或」 操作的处理:

分成多个路径,加一个开始节点,一个结尾节点,通过ε 边可到达每个路径。

2、对于 「与」操作的处理:

将路径直接首尾连接起来,形成一条路径。

3、* 计算符的处理:


4、+计算符的处理:


5、?运算符的处理:


那么一个正则表达式基本就是由以上的基础操作构成。

thmopson构造算法其实是一个自我递归的过程?

ε 边的内涵是可以不读入字符就跳转到另一个状态。

εNFA经过处理可以得到NFA。

NFA经过转换之后可以得到DFA。

每个NFA必然可以转化成一个等价的DFA。

DFA和NFA的效率差异:

构造DFA的代价远大于NFA。

但是DFA构造好了之后,执行效率优于NFA,如果一个串的长度是n,则匹配的时间负责度就是0(n)。

NFA在匹配过程中有大量的分支和回溯,假设NFA的状态数为s,则改匹配算法的时间复杂度为0(ns)。

NFA被称为表达式主导引擎:表达式主导的特点是每个子表达式都是独立的,不存在内在联系。

DFA被称为文本主导引擎:会逐个读入文本字符串,控制整个引擎的执行过程。


DFA能保证最长匹配。

NFA支持更多功能,捕获group,环视,占有优先量词等高级功能,这些功能都基于子表达式独立进行匹配。因此在编程语言里面使用的正则表达式库都是基于NFA的。





  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值