关于java正则表达式贪婪模式和勉强模式的研究

解释:

     greedy :贪婪

     reluctant:勉强,不情愿

      java 正则表达式默认用的是greedy贪婪匹配模式既是这种类型(.*)的最长匹配,如果需要最短匹配则改为(.*?)即是勉强匹配模式。

原理分析:

      如果是贪婪匹配模式,正则表达式引擎会一直匹配到字符串最后,当匹配为false时,通过
回溯的方式,倒退找到倒数第一个匹配位置,返回匹配结果

      如果是勉强匹配模式,正则表达式引擎会匹配到符合pattern的末尾位置那个字符,然后再往后走一步,发现匹配为false,又回溯到找到回退的最近一个匹配为true的位置,返回结果。

看代码:

例一:

@Test
	public void test51(){
		String str = "aaa\"bbb\"ccc\"ddd\"eee";
		System.out.println(str);
		str = str.replaceAll("\"(.*)\"", "@");
		System.out.println(str);
	}


输出:

aaa"bbb"ccc"ddd"eee
aaa@eee

例二:

	@Test
	public void test52(){
		String str = "aaa\"bbb\"ccc\"ddd\"eee";
		System.out.println(str);
		
		str = str.replaceAll("\"(.*?)\"", "@");
		System.out.println(str);
		
	}


输出:

aaa"bbb"ccc"ddd"eee
aaa@ccc@eee

例三:

@Test
	public void test7(){
		// Greedy quantifiers
	    String match = find("A.*c", "AbcAbc");  // AbcAbc
	    System.out.println(match);
	    match = find("A.+", "AbcAbc");          // AbcAbc
	    System.out.println(match);
	    // Nongreedy quantifiers
	    match = find("A.*?c", "AbcAbc");        // Abc
	    System.out.println(match);
	    match = find("A.+?", "AbcAbc");         // Ab
	    System.out.println(match);

	}
	
	public  String find(String patternStr, CharSequence input) {
        Pattern pattern = Pattern.compile(patternStr);
        Matcher matcher = pattern.matcher(input);
        if (matcher.find()) {
            return matcher.group();
        }
        return null;
    }



 


 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值