js-贪婪和惰性匹配

最新推荐文章于 2024-09-15 22:31:42 发布

weixin_34342905

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量92

点赞数

文章标签： python

原文链接：https://my.oschina.net/lgmcolin/blog/85216

版权

2019独角兽企业重金招聘Python工程师标准>>>

1.贪婪匹配(greedy)

它会匹配尽可能多的字符。它首先看整个字符串，如果不匹配，对字符串进行收缩；遇到可能匹配的文本，停止收缩，对文本进行扩展，当发现匹配的文本时，它不着急将该匹配保存到匹配集合中，而是对文本继续扩展，直到无法继续匹配或者扩展完整个字符串，然后将前面最后一个符合匹配的文本(也是最长的)保存起来到匹配集合中。所以说它是贪婪的。

光看上面的定义，我们很难有一个生动的认识，现在假设我们要匹配下面 和 之间的文本。为了做演示，尽管不符合 HTML 的定义，我们再加入一段和</c>之间的文本：

nowamagic.net is a good website to learn IT skills</c>.

`1`	`<b>.*</b>`

效果演示

nowamagic.net is a good website to learn IT skills.

本例代码

 
function reg_replace() 
 
{ 
 
    var test = document.getElementById("test"); 
 
    aim = "<b>.*</b> "; 
 
    var regex = new RegExp("("+aim+")","g"); 
 
    test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>"); 
 
}

这样匹配显然不是我们的初衷，它仅找到了一个匹配，而通常情况下，我们希望得到的是junior 和 living 两个匹配。

贪婪匹配的匹配过程

`01`	`//不匹配，收缩`

`02`	`nowamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>.`

`03`	`//不匹配，收缩`

`04`	`owamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>.`

`05`	`//不匹配，收缩`

`06`	`wamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>.`

`07`	`...` `//中间略`

`08`	`// 找到可能匹配的，扩展`

`09`	`<span style="background-color:orange"><</span>b>good</b> website to <b>learn</b> IT <b>skills</c>.`

`10`	`// 找到可能匹配的，扩展`

`11`	`<span style="background-color:orange"><b</span>>good</b> website to <b>learn</b> IT <b>skills</c>.`

`12`	`// 找到可能匹配的，扩展`

`13`	`<span style="background-color:orange"><b></span>good</b> website to <b>learn</b> IT <b>skills</c>.`

`14`	`...` `//中间略`

`15`	`//找到一个匹配，但是并不保存到结果集中，而是继续进行扩展`

`16`	`<span style="background-color:orange"><b>good</b></span> website to <b>learn</b> IT <b>skills</c>.`

`17`	`<span style="background-color:orange"><b>good</b> </span>website to <b>learn</b> IT <b>skills</c>.`

`18`	`// 找到可能匹配的，扩展`

`19`	`<span style="background-color:orange"><b>good</b> website to <b>learn</b></span> IT <b>skills</c>.`

`20`	`//字符串结束，将前面找到的最后一个匹配 <b>good</b> website to <b>learn</b> 保存到匹配结果集中`

2.惰性匹配

惰性匹配(lazy)

它会匹配尽可能少的字符，它从第一个字符开始找起，一旦符合条件，立刻保存到匹配集合中，然后继续进行查找。所以说它是懒惰的。

还是这个例子：

nowamagic.net is a good website to learn IT skills</c>.

`1`	`<b>.*</b>`

效果演示

nowamagic.net is a good website to learn IT skills.

本例代码

 
function reg_replace() 
 
{ 
 
    var test = document.getElementById("test"); 
 
    aim = "<b>.*</b> "; 
 
    var regex = new RegExp("("+aim+")","g"); 
 
    test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>"); 
 
}

这样匹配显然不是我们的初衷，它仅找到了一个匹配，而通常情况下，我们希望得到的是good 和 learn 两个匹配。

解决的办法，就是上面说到的惰性匹配，它的语法如下表所示：

贪婪匹配	惰性匹配	匹配描述
?	??	匹配 0 个或 1 个
+	+?	匹配 1 个或多个
*	*?	匹配 0 个或多个
{n}	{n}?	匹配 n 个
{n,m}	{n,m}?	匹配 n 个或 m 个
{n,}	{n,}?	匹配 n 个或多个

对于本例，当我们再使用惰性匹配。

`1`	`<b>.*?</b>`

效果演示

nowamagic.net is a good website to learn IT skills.

惰性匹配的匹配过程

 
n   // 不匹配，继续 
 
no  // 不匹配，继续 
 
...  // 中间略 
 
nowamagic.net is a <span style="background-color:orange"><</span>    // 找到可能匹配的字符，继续 
 
nowamagic.net is a <span style="background-color:orange"><b</span>   // 找到可能匹配的字符，继续 
 
...  // 中间略 
 
//找到匹配，保存到结果集中，继续进行剩下的文本。 
 
nowamagic.net is a <span style="background-color:orange"><b>good</b></span> website to <b>learn</b> IT <b>skills</c>.  
 
w   // 不匹配，继续 
 
we  // 不匹配，继续 
 
website to <span style="background-color:orange"><</span>        // 找到可能的匹配，继续    
 
website to <span style="background-color:orange"><b</span>   // 找到可能的匹配，继续 
 
...  // 中间略 
 
//找到匹配，保存到结果集中，继续进行剩下的文本。 
 
website to <span style="background-color:orange"><b>learn</b></span> 
 
I   //不匹配，继续 
 
IT  //不匹配，继续 
 
IT <span style="background-color:orange"><</span>    // 找到可能的匹配，继续 
 
IT <span style="background-color:orange"><b</span>   // 找到可能的匹配，继续 
 
...  // 中间略 
 
IT <span style="background-color:orange"><b>skills</</span>c>.  // 匹配失败，继续找 
 
IT <b>skills</c>.   // 不匹配，继续 
 
// 字符串结束，匹配结束。一共找到了两个匹配<b>good</b>和<b>learn</b> 
 
IT <b>skills</c>.