* 贪心、懒惰和占有
量词自身是贪心的。贪心的量词会首先匹配整个字符串。尝试匹配时,他会选定尽可能多的内容,也就是整个
输入。量词首次尝试匹配整个字符串,如果失败则回退一个字符后再次尝试。这个过程叫回溯。他会每次回退一个字符,直到找到匹配的内容或者没有字符可尝试为止。此外,他还记录所有的行为,因此相较另两种方式他对资源的消耗最大。他先吃尽所有的字符,然后每次吐出来一点,慢慢咀嚼消化。
懒惰的量词则使用另一种策略。他从目标的起始位置开始尝试寻找匹配,每次检查字符串的一个字符,寻找他
匹配的内容。最后,他会尝试匹配整个字符串。要是一个量词成为懒惰的,必须在普通量词后添加一个问号
(?)。他每次只吃一点。
占有量词会覆盖整个目标然后尝试寻找匹配内容,但他只尝试一次,不会回溯。占有量词就是在普通量词之后添加一个加号(+)。他不咀嚼而是直接吞咽,然后才想知道吃的是什么。
* 用*、+和?进行匹配
?:零个或一个
+:一个或多个
*:零个或多个
* 匹配特定次数
使用花括号可以限制某个模式在某个范围内匹配的次数,未经修饰的量词就是贪心量词。
范围语法总结:
{n} : 精确匹配n次
{n,} :匹配n次或更多次
{m,n} :匹配m至n次
{0,1} :匹配零次或一次(与?相同)
{1,0} :匹配一次或更多次(与+相同)
{0,} :匹配零次或更多次(与*相同)
* 懒惰量词
?? 懒惰匹配零次或一次
+? 懒惰匹配一次或多次
*? 懒惰匹配零次或多次
{n}? 懒惰匹配n次
{n,}? 懒惰匹配n次或多次
{m,n}? 懒惰匹配m至n次
* 占有量词
?+ 占有式匹配零次或一次
++ 占有式匹配 一次或多次
*+ 占有式匹配零次或多次
{n}+ 占有式匹配n次
{n,}+ 占有式匹配n次或更多次
{m,n}+ 占有式匹配匹配m至n次
占有匹配没有回溯,他一下就选定了所有的输入,不再汇过来查看。