正则表达式回溯导致CPU飙高,贪婪、勉强、独占模式

本来以为正则表达式是个非常轻的东西,不会出什么幺蛾子,昨天看一个公众号的技术文章,因为正则表达式的使用不当,竟然导致CPU飙到100%

主要原因是回溯

什么是回溯

假如现在待匹配的字符串是:1111a

正则表达式为:[\d,a]+a

此时对[\d,a]是默认的贪婪模式,匹配的大致流程:
第一个字符1是否满足[\d,a],满足
第二个字符1是否满足[\d,a],满足
…..
最后一个字符a是否满足[\d,a],满足
后面没有字符匹配正则表达式最后的a了,匹配失败,!!回溯!!
回到最后一个字符,匹配正则表达式的a,匹配成功(此处如果匹配失败,会继续回到倒数第二个字符去匹配,依次类推,所以如果字符串很长,会出现回溯很多)

如果是非贪婪模式(勉强模式):[\d,a]+?a
首先第一个字符匹配[\d,a],因为是非贪婪的,所以第二个字符就开始匹配a,匹配失败,再用第二个字符匹配[\d,a],依次类推

独占模式:[\d,a]++a

以前都没听过或者使用过这个模式,挺新鲜的,它其实就是不会回溯的贪婪模式,回头看贪婪模式的步骤,如果是独占模式,在倒数第二步匹配失败的时候,就会直接返回匹配失败,不会再回溯去尝试,所以其实是个很实用很高效的模式

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值