java nfa dfa_NFA 、DFA 简述

最新推荐文章于 2023-04-23 16:12:47 发布

weixin_39808803

最新推荐文章于 2023-04-23 16:12:47 发布

阅读量322

点赞数

文章标签： java nfa dfa

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39808803/article/details/114545142

版权

目前常见的正则表达引擎总体分为2种，DFA (确定型有穷状态自动机) 和 NFA (非确定型有穷状态自动机)

如果细分，NFA 可以分为传统NFA和POSIX NFA

那么如何区分3者

如果某种正则引擎如果他不能匹配能很快给出结果，那么他可能是DFA

如果只有在能够匹配的时候才能快速给出结果，那么就是传统NFA

如果无论能不能匹配，匹配的时间都基本一致，那么就是POSIX NFA

why ？

首先先看 DFA，DFA 是文本主导的表达式引擎，实际上，对于确定的DFA表达式，状态的个数是确定的，这个也是为什么是确定型有穷状态

通过DFA 表达式，可以分析出所有可能的匹配路径，也就是说，在匹配还没开始的时候，所有路径都已经确定了(如果遇到某个字符就走某个指定的路径)，接下来需要做的就是在匹配文本，然后删掉不符合的路径，如果中途存在没有的路径，那么匹配失败，如果到最后存在多条匹配成功的路径，那么取匹配最长的路径

另外DFA 不支持反向引用和环视

而NFA 是表达式主导的引擎，也就是说实际上是拿文本到表达式测试，如果成功就继续匹配，失败就回溯或者选择其他分支或者报告匹配失败

在NFA中分为两种引擎,传统NFA和POSIX NFA

传统NFA和POSIX NFA的区别是传统NFA 如果如果找到一个匹配，那么就会直接报告这个匹配，POSIX NFA会尝试所有可能的匹配，如果有多个匹配，返回最长最左的匹配

所以在能够匹配的时候NFA 只需要找到一个匹配就能返回了，相对速度会很快，因为POSIX NFA 需要尝试所有可能才会报告是否匹配成功，所以时间是一致的。

引擎类型

程序

忽略优先量词(懒惰)

捕获型括号

回溯

DFA

awk(大多数版本)、egrep(大多数版本)、flex、lex、MySQL、Procmail

不支持

不支持

不支持

传统型 NFA

GNU Emacs、Java、grep(大多数版本)、less、more、.NET 语言、PCRE library、Perl、PHP(所有三套正则库)、Python、Ruby、sed(大多数版本)、vi

支持

支持

支持，但性能差

POSIX NFA

mawk、Mortice Kern Systems’utilities、GNU Emacs(明确指定时使用)

不支持

支持

支持，但性能差

DFA/NFA 混合

GNU awk、GNU grep/egrep、Tcl

支持

支持

DFA 支持

weixin_39808803

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java nfa dfa_NFA 、DFA 简述

目前常见的正则表达引擎总体分为2种，DFA (确定型有穷状态自动机) 和 NFA (非确定型有穷状态自动机)如果细分，NFA 可以分为传统NFA和POSIX NFA那么如何区分3者如果某种正则引擎如果他不能匹配能很快给出结果，那么他可能是DFA如果只有在能够匹配的时候才能快速给出结果，那么就是传统NFA如果无论能不能匹配，匹配的时间都基本一致，那么就是POSIX NFAwhy ？首先先看 DFA，...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。