解释:
greedy :贪婪
reluctant:勉强,不情愿
java 正则表达式默认用的是greedy贪婪匹配模式既是这种类型(.*)的最长匹配,如果需要最短匹配则改为(.*?)即是勉强匹配模式。
原理分析:
如果是贪婪匹配模式,正则表达式引擎会一直匹配到字符串最后,当匹配为false时,通过
回溯的方式,倒退找到倒数第一个匹配位置,返回匹配结果
如果是勉强匹配模式,正则表达式引擎会匹配到符合pattern的末尾位置那个字符,然后再往后走一步,发现匹配为false,又回溯到找到回退的最近一个匹配为true的位置,返回结果。
看代码:
例一:
@Test
public void test51(){
String str = "aaa\"bbb\"ccc\"ddd\"eee";
System.out.println(str);
str = str.replaceAll("\"(.*)\"", "@");
System.out.println(str);
}
输出:
aaa"bbb"ccc"ddd"eee
aaa@eee
例二:
@Test
public void test52(){
String str = "aaa\"bbb\"ccc\"ddd\"eee";
System.out.println(str);
str = str.replaceAll("\"(.*?)\"", "@");
System.out.println(str);
}
输出:
aaa"bbb"ccc"ddd"eee
aaa@ccc@eee
例三:
@Test
public void test7(){
// Greedy quantifiers
String match = find("A.*c", "AbcAbc"); // AbcAbc
System.out.println(match);
match = find("A.+", "AbcAbc"); // AbcAbc
System.out.println(match);
// Nongreedy quantifiers
match = find("A.*?c", "AbcAbc"); // Abc
System.out.println(match);
match = find("A.+?", "AbcAbc"); // Ab
System.out.println(match);
}
public String find(String patternStr, CharSequence input) {
Pattern pattern = Pattern.compile(patternStr);
Matcher matcher = pattern.matcher(input);
if (matcher.find()) {
return matcher.group();
}
return null;
}