根据正则表达式创建NFA的Thompson算法 python实现

最新推荐文章于 2024-11-16 17:35:07 发布

纳颜

最新推荐文章于 2024-11-16 17:35:07 发布

阅读量2.3k

点赞数 4

分类专栏：编译器文章标签：正则表达式算法编辑器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52293362/article/details/126368664

版权

说明：1.在学习过程中没看到此论坛中有好的python实现，所以写一篇文章作为补充。

2.不赘述正则表达式和NFA的概念，着重描述python的算法实现，以及过程中用到的数据结构（十分精妙）。

创建NFA的第一步是解析正则表达式，我看龙书中使用分析树来解析的，在这里卡了一段时间，后来查资料发现Thompson的原论文用的解析法是将正则式从前缀形式转换成后缀形式，对我来讲同样清晰易懂而且好实现，实现的复杂度时间复杂度是O(n)。举例来说，原正则表达式为a.b,a|b,(a|b).c,(a|b)*那么转换后分别为ab., ab|, ab|c和ab|*(符号“.”表示联合，“|”表示或，“*”表示任意）。这个转换算法叫 Shunting Yard 算法：

def shunt(infix):
    # Curly braces = dictionary
    # *, | are repetition operators. They take precedence over concatenation and alternation operators
    # * = Zero or more
    # . = Concatenation
    # | =  Alternation
    specials = {'*': 50, '.': 40, '|': 30}

    pofix = ""
    stack = ""

    # Loop through the string one character at a time
    for c in infi

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。