JAVA正则表达式-捕获组与非捕获组

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
public class PatternTest {  
  
    public static void main(String[] args) {  
        String text = "<textarea rows=\"20\" cols=\"70\">nexus maven repository index properties updating index central</textarea>";  
        String reg = "<textarea.*?>.*?</textarea>";  
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group());  
        }  
    }  
  
}  

运行结果:

<textarea rows="20" cols="70">nexus maven repository index properties updating index central</textarea> 
现在,如果我只想匹配到<textarea>内的文本内容即“ nexus maven repository index properties updating index central ”,怎么做呢?这时候就要用到捕获组了。上述代码中“ <textarea.*?>.*?</textarea>”最中间的“.*?”是匹配内容的正则表达式,只需要将它用括号括起来,就是一个捕获组了。
import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
public class PatternTest {  
  
    public static void main(String[] args) {  
        String text = "<textarea rows=\"20\" cols=\"70\">nexus maven repository index properties updating index central</textarea>";  
        //下面的正则表达式中共有四个捕获组:(<textarea.*?>)、(.*?)、(</textarea>)和整个匹配到的内容  
        String reg = "(<textarea.*?>)(.*?)(</textarea>)";    
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group(0)); // 整个匹配到的内容  
            System.out.println(m.group(1)); // (<textarea.*?>)  
            System.out.println(m.group(2)); // (.*?)  
            System.out.println(m.group(3)); // (</textarea>)  
        }  
    }  
}  
运行结果:

<textarea rows="20" cols="70">nexus maven repository index properties updating index central</textarea>  
<textarea rows="20" cols="70">  
nexus maven repository index properties updating index central  
</textarea>  

从上述代码得出结论:正则表达式中每个"()"内的部分算作一个捕获组,每个捕获组都有一个编号,从1,2...,编号0代表整个匹配到的内容。

至于非捕获组,只需要将捕获组中"()"变为"(?:)"即可,代码说话:

import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
public class PatternTest {  
  
    public static void main(String[] args) {  
        String text = "<textarea rows=\"20\" cols=\"70\">nexus maven repository index properties updating index central</textarea>";          // 下面的正则表达式中共有二个捕获组:(.*?)和整个匹配到的内容,两个非捕获组:(?:</textarea>)和(?:<textarea.*?>)  
        String reg = "(?:<textarea.*?>)(.*?)(?:</textarea>)";  
        Pattern p = Pattern.compile(reg);  
        Matcher m = p.matcher(text);  
        while (m.find()) {  
            System.out.println(m.group(0)); // 整个匹配到的内容  
            System.out.println(m.group(1)); // (.*?)  
        }  
    }  
}  
运行结果:

<textarea rows="20" cols="70">nexus maven repository index properties updating index central</textarea>  
nexus maven repository index properties updating index central  
如果试图运行: System.out.println(m.group(2));将会抛出异常,因为不存在编号为2的捕获组。





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值