(.+)默认是贪婪匹配
(.+?)为惰性匹配
举个例子,我这边用python做测试。
import re
pattern1 = “a.+b”
pattern2 = “a.+?b”
string = ‘abcdabcdabcdabcd’
result1 = re.match(pattern1,string)
result2 = re.match(pattern2,string)
print(result1)
print(result2)
运行之后的结果如下:
<re.Match object; span=(0, 14), match=’abcdabcdabcdab’>
<re.Match object; span=(0, 6), match=’abcdab’>
解析:
1.贪婪匹配是先看整个字符串是否匹配,如果不匹配,它会去掉字符串的最后一个字符,并再次尝试。如果还不匹配,那么再去掉当前最后一个,直到发现匹配或不剩任何字符。所以可以看到result1的打印结果是abcdabcdabcdab,最大限度的前后匹配结果。
2.惰性匹配是从左侧第一个字符开始向右匹配, 先看第一个字符是不是一个匹配, 如果不匹配就加入下一个字符再尝式匹配, 直到发现匹配.
综上,.+?实际用的大地方会更多一定,适合用来精确疲惫。
欢迎关注本人公众号和小程序,谢谢