复杂正则表达式一

表达式 "(\w)((?=\1\1\1)(\1))+" 在匹配字符串 "aaa ffffff 999999999" 时,将可以匹配6个"f"的前4个,可以匹配9个"9"的前7个

分析:
一、

(\w)(\1)
1. (\w) -- \w,一个字符,括号表示一个子匹配,第一个括号是"\1",第二个括号是"\2",……。
2. (\w)(\1) -- 一个字符,后面紧跟一个相同的字符。
(之前复杂的正则,转为基本的(\w)(\1)。化繁为简,先弄清楚简单的,再向复杂推去。)

运行得:aa | ff | ff | ff | 99 | 99 | 99 | 99 | ,3个a,匹配了一次;6个f,匹配了三次;9个9,匹配了四次。
可见,(\w)(\1) -- 每次搜索两个字符,该字符与下一个相同即为true。


二、

(\w)(?=\1\1\1)
1. (?=\1) -- ?=,据“正则表达式系统教程":

(?=pattern)  正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

2. (\w)(?=\1\1\1) -- 一个字符,后面紧跟三个相同的字符。但后三个字符不获取,也不消耗字符:如匹配“ffffff”,第一次查找,匹配到前四个ffff;第二次查找,从第二个“f”开始(不是从第五个开始,如无“?=”:(\w)(\1\1\1),则是从第五个开始),匹配了第二个“f”至第五个“f”;第三次查找,匹配了第三个“f”至第六个“f”;第四次查找,只剩下三个“f”,匹配不到。

运行得:f | f | f | 9 | 9 | 9 | 9 | 9 | 9 | ,四个字符连续相同才符合条件,但每次查找只消耗一个字符,即 index只+1,不是+4。


(\w)(?=\1\1\1)(\1)
运行得:ff | ff | 99 | 99 | 99 | 
(\w)(?=\1\1\1)(\1) --- 相当于执行一次(\w)(?=\1\1\1)匹配,接着执行一次(\w)(\1) ,移到下一个索引,再继续前面的操作,如此循环。
(\w)(?=\1\1\1),参考“二、”,接着执行 (\w)(\1),(\w)已完成,到(\1) 了,它从第二个“f”开始,查找前面的字符相同否,同,匹配。第二次查找,从第三个“f”开始,也是只消耗两个 “f" 字符。第三次查找,只剩下两个“f”,(\w)(?=\1\1\1)匹配不到。9个9的查找类同,三次查找后,余 9-2*3=3 个“9”,”,(\w)(?=\1\1\1)需4个“9”才合,查找结束。假如10个“9”的话,第四次能匹配成功,出现四个“99”。


(\w)(?=\1\1\1)(\1)+

运行得:ffffff | 999999999 | 
1. (\1)+ --- +代表一个或多个,(\1)+ 表示第一个的子匹配一个或多个。
2. (\w)(?=\1\1\1)(\1)+ --- 相当于先 (\w)(?=\1\1\1),再 (\w)(\1)+ ,接着下一索引继续。
 (\w)(?=\1\1\1),参考上面,接着执行 (\1)+,从第二个“f”开始,它会将余下的“f” 全部匹配掉,“ffffff”的查找就结束了(接下来的是第二轮查找,对 9个“9”)。


(\w)((?=\1\\1\1)(\1))+

运行得:ffff | 9999999 | 
1. ((?=\1\1\1)(\1))+  --- 是整个“(?=\1\1\1)(\1)”的一个或多个。先(?=\1\1\1),查找三个与第一个子匹配相合的;再(\1) ,查找一个与第一个子匹配相合的;然后因有“+”,匹配多次。

2. (\w)((?=\1\1\1)(\1))+  --- 以“ffffff” 6个“f” 为例:①执行(\w):找到一字符“f”,符合, ②执行(?=\1\1\1):从第二个“f”开始,查找三个“f”,符合, ③执行(\1):因前面不消耗字符,从第二个“f”开始,查找一个“f”,符合,④整个“(?=\1\1\1)(\1)”是 + 的,要匹配多次,相当于内循环,“(?=\1\1\1)(\\1)”不断匹配下去,现从第三个“f”开始,查找三个“f”,符合,⑤现又到(\1),从第三个“f”开始,查找一个“f”,符合,⑥…………,最后到剩下2个“f”时,(?=\1\1\1) 不合,结束此轮查找。这样,(\w)只执行一次,匹配最前面的“f”,“(?=\1\1\1)(\1)”不断匹配,执行三次,匹配了第二至第四个“f”,总共匹配了前面的四个“f”。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值