正则表达式贪婪匹配模式,对于初学者,往往也很容易出错。有时候需要匹配一个段代码内容,发现匹配与想要不一致。发现原来,跟贪婪模式有关系。如下,我们看下例子:
什么是贪婪模式
字符串有: “<h3>abd</h3><h3>bcd</h3>”,我们想匹配<h3>…</h3>内容,正则表达式如下:
1、h3开头与结尾,”<h3>待添加</h3>” <h3></h3>都作为普通字符
2、中间可以出现任意字符,个数可以是0个或者多个,正则表达式可以用:.* ,“.”代表任意字符,默认模式不匹配换行,”*” 重复前面字符0个或者多个
3、最终我们考虑结果将是:”<h3>.*</h3>” ,也可以是:”<h3>.{0,}</h3>” {}代表,重复前面指定个数字符
什么是懒惰模式
既然上面几种,表示字符重复个数,元字符默认都是贪婪模式。如果,我们需要最小长度匹配,也就是懒惰模式,怎么样写正则表达式呢?其实,正则表达式里面通用方法是,在表示重复字符元字符,后面加多一个”?”字符即可。上面正则表达式可以写成:”<h3>.*?</h3>”,或者”<h3>.{0,}?</h3>” 都可以。