1. 总述
贪婪模式感觉就像,只要符合我当前的规则就一直匹配,才不会去管正则表达式中我后面的限制规则
2. 例子
static final Pattern CONTENT_PATTERN1 = Pattern.compile("_\\S*?==");
static final Pattern CONTENT_PATTERN2 = Pattern.compile("_\\S*==");
@Test
public void splitContent1() {
String content = "_123==_456==";
List<String> contentList = new ArrayList<>();
Matcher matcher = CONTENT_PATTERN2.matcher(content);
while (matcher.find()) {
contentList.add(matcher.group());
}
System.out.println(contentList);
}
3. 分析
- 当使用CONTENT_PATTERN1和CONTENT_PATTERN2,进行正则匹配,得到的结果与预期完全不同(contentList的元素个数不同)。
- 区别就在于Pattern的一个‘?’, 进行非贪婪模式匹配。当使用’\S’,因为是Java所以写成’\\S’, 匹配任何非空白字符,‘*’,匹配0次或多次。
- 根据总结,贪婪模式下,尽管正则表达式后面有’==‘加以限制,但内容中’==‘部分仍属于’\\S’的配配规则,所以会继续匹配下去。
4. 总结
当我们使用‘\S’, ‘.’, 类似这种字符进行匹配文本,且使用’*‘或者’+'这种多次匹配规则时,一定要考虑是否要加入非贪婪模式限定符。