正则表达式贪婪与非贪婪模式
正则表达式的贪婪与非贪婪匹配
如:
String str = "abcaxc";
Patter p = "ab*c";
贪婪匹配: 正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。
非贪婪匹配: 就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。
编程中如何区分两种模式
默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。
量词:{m,n}:m到n个
*:任意多个
+:一个到多个
?:0或一个
程序实例
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegularTest {
public static void main(String[] arg){
String text="(content:\"rcpt to root\";pcre:\"word\";)";
String rule1="content:\".+\""; //贪婪模式
String rule2="content:\".+?\""; //非贪婪模式
System.out.println("文本:" + text); // (content:"rcpt to root";pcre:"word";)
System.out.println("贪婪模式:" + rule1); // content:".+"
Pattern p1 = Pattern.compile(rule1);
Matcher m1 = p1.matcher(text);
while(m1.find()){
System.out.println("匹配结果:"+m1.group(0)); // content:"rcpt to root";pcre:"word"
}
System.out.println("非贪婪模式:" + rule2); // content:".+?"
Pattern p2 =Pattern.compile(rule2);
Matcher m2 = p2.matcher(text);
while(m2.find()){
System.out.println("匹配结果:"+m2.group(0)); // content:"rcpt to root"
}
}
}