Java正则表达中Greedy Reluctant Possessive 的区别


上一篇文章《编程思想之正则表达式 》中讲了正则表达式的原理、使用方法和常见的正则表达式总结,本文将进一步探讨Java正则表达中GreedyReluctantPossessive三种策略的区别。

从Java的官方文档http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html中我们可以看到,正则表达式表示数量词的符号有三套,分别是Greedy(贪婪的)Reluctant(勉强的)Possessive(独占的)。其含意如下:

Greedy 数量词

X?

X,一次或一次也没有

X*

X,零次或多次

X+

X,一次或多次

X{n}

X,恰好 n 次

X{n,}

X,至少 n 次

X{n,m}

X,至少 n 次,但是不超过 m 次

 

 

Reluctant 数量词

X??

X,一次或一次也没有

X*?

X,零次或多次

X+?

X,一次或多次

X{n}?

X,恰好 n 次

X{n,}?

X,至少 n 次

X{n,m}?

X,至少 n 次,但是不超过 m 次

 

 

Possessive 数量词

X?+

X,一次或一次也没有

X*+

X,零次或多次

X++

X,一次或多次

X{n}+

X,恰好 n 次

X{n,}+

X,至少 n 次

X{n,m}+

X,至少 n 次,但是不超过 m 次

 

GreedyReluctantPossessive的区别

实例说话

看上面的表格我们发现这三种数量词的含意都相同(X?X??X?+都表示一次或一次也没有),但他们之间还是有一些细微的区别的。我们先来看一个例子:

1.Greedy

public static void testGreedy() {
	Pattern p = Pattern.compile(".*foo");
	String strText = "xfooxxxxxxfoo";
	Matcher m = p.matcher(strText);
	while (m.find()) {
		System.out.println("matched form " + m.start() + " to " + m.end());
	}
}
结果:

matched form 0 to 13

 

2.Reluctant

public static void testReluctant() {
	Pattern p = Pattern.compile(".*?foo");
	String strText = "xfooxxxxxxfoo";
	Matcher m = p.matcher(strText);
	while (m.find()) {
		System.out.println("matched form " + m.start() + " to " + m.end());
	}
}
结果:

matched form 0 to 4

matched form 4 to 13

 

 

3.Possessive

public static void testPossessive() {
	Pattern p = Pattern.compile(".*+foo");
	String strText = "xfooxxxxxxfoo";
	Matcher m = p.matcher(strText);
	while (m.find()) {
		System.out.println("matched form " + m.start() + " to " + m.end());
	}
}
结果:

 

//未匹配成功

 

原理讲解

Greedy数量词被称为“贪婪的”是因为匹配器被强制要求第一次尝试匹配时读入整个输入串,如果第一次尝试匹配失败,则从后往前逐个字符地回退并尝试再次匹配,直到匹配成功或没有字符可回退。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 13

 

其比较过程如下

 


Reluctant采用与Greedy相反的方法,它从输入串的首(字符)位置开始,在一次尝试匹配查找中只勉强地读一个字符,直到尝试完整个字符串。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 4

      matched form 4 to 13

 

其比较过程如下

 

 

Possessive数量词总是读入整个输入串,尝试一次(仅且一次)匹配成功,不像GreedyPossessive从不回退,即便这样做也可能使整体匹配成功。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:

      //未匹配成功

 

其比较过程如下

 

 

参考文章:http://docs.oracle.com/javase/tutorial/essential/regex/quant.html

 

再来看看几个例子:

模式串:.+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

 

 

模式串:.+?[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 4

 

 

模式串:.{1,9}+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

 

模式串:.{1,10}+[0-9]

查找串:abcd5aabb6

结果:匹配失败

 

 

如果您有什么疑惑和想法,请在评论处给予反馈,您的反馈就是最好的测评师!由于本人技术和能力有限,如果本博文有错误或不足之处,敬请谅解并给出您宝贵的建议!

 

 

========================欢迎关注编程思想系列文章========================

编程思想之正则表达式

编程思想之迭代器

编程思想之递归

编程思想之回调

 

 

  • 8
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 16
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

陌尘(MoChen)

爱打赏的人技术成长更开哦~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值