问题3:正则表达式中Matcher类中group()方法的详细解析

原来,group是针对()来说的,group(0)就是指的整个串,group(1) 指的是第一个括号里的东西,group(2)指的第二个括号里的东西。

程序如下
Java代码 收藏代码

package cn.mingyuan.regexp.singlecharacter;  
  
import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
public class GroupIndexAndStartEndIndexTest {  
  
/** 
* @param args 
*/  
public static void main(String[] args) {  
   // TODO Auto-generated method stub  
   String str = "Hello,World! in Java.";  
   Pattern pattern = Pattern.compile("W(or)(ld!)");  
   Matcher matcher = pattern.matcher(str);  
   while(matcher.find()){  
    System.out.println("Group 0:"+matcher.group(0));//得到第0组——整个匹配  
    System.out.println("Group 1:"+matcher.group(1));//得到第一组匹配——与(or)匹配的  
    System.out.println("Group 2:"+matcher.group(2));//得到第二组匹配——与(ld!)匹配的,组也就是子表达式  
    System.out.println("Start 0:"+matcher.start(0)+" End 0:"+matcher.end(0));//总匹配的索引  
    System.out.println("Start 1:"+matcher.start(1)+" End 1:"+matcher.end(1));//第一组匹配的索引  
    System.out.println("Start 2:"+matcher.start(2)+" End 2:"+matcher.end(2));//第二组匹配的索引  
    System.out.println(str.substring(matcher.start(0),matcher.end(1)));//从总匹配开始索引到第1组匹配的结束索引之间子串——Wor  
   }  
}  
  
}  

程序的运行结果为:
Java代码 收藏代码

Group 0:World!  
Group 1:or  
Group 2:ld!  
Start 0:6 End 0:12  
Start 1:7 End 1:9  
Start 2:9 End 2:12  
Wor  

总结:其实group(),start(),end()所带的参数i就是正则表达式中的子表达式索引(第几个子表达式),由于刚开始对Java正则表达式中的组的概念不清晰,导致理解困难。当将“组”的概念与“子表达式”对应起来之后,理解matcher的group,start,end就完全没有障碍了。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值