正则表达式的独占模式、懒惰模式(也称为非贪婪模式)和贪婪模式(默认模式)在匹配行为上存在显著的区别。以下是这三种模式的详细解释和区别:
1、贪婪模式(Greedy):
默认情况下,正则表达式的匹配都会采用贪婪模式。
匹配器被强制要求第一次尝试匹配时读入整个输入串,如果第一次尝试匹配失败,则从后往前逐个字符地回退并尝试再次匹配,直到匹配成功或没有字符可回退。
贪婪模式下,会尽可能多的匹配符合正则表达式的内容。
2、懒惰模式(Lazy/Reluctant):
也称为非贪婪模式。
从输入串的首字符位置开始,在一次尝试匹配查找中只勉强地读一个字符,直到尝试完整个字符串。
懒惰模式尽可能少地匹配所搜索的字符串。
开启方法为正则表达式该部分后加上?,例如ab{1,3}?c,在匹配abc和abbc时均不会发生回溯。
3、独占模式(Possessive):
可以理解为不会回溯的贪婪模式。
在独占模式下,正则表达式尽可能长地去匹配字符串,一旦匹配不成功就会结束匹配而不会回溯。
使用方式:在量词后面加上加号(+),正则就变成了独占模式,例如ab{1,3}+c。
独占模式由于不会发生回溯,所以资源消耗较小,但匹配失败时不会像贪婪模式那样尝试其他可能性。
4、总结归纳:
贪婪模式会尽可能多地匹配字符,直到满足条件或没有字符可匹配。
懒惰模式会尽可能少地匹配字符,直到满足条件或已经匹配了整个字符串。
独占模式在匹配时会尝试最长的匹配,但如果匹配失败则不会回溯,因此它更加“坚决”和“直接”。