Matcher类

Matcher类:
使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中
()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的,
以及这些组和组的下标怎么对应的.
下面我们看看一个小例子,来说明这个问题
引用
\w(\d\d)(\w+)

这个正则表达式有三个组:
整个\w(\d\d)(\w+) 是第0组 group(0)
(\d\d)是第1组 group(1)
(\w+)是第2组 group(2)
我们看看和正则表达式匹配的一个字符串x99SuperJava,
group(0)永远都是匹配整个表达式的字符串的那部分x99SuperJava
group(1)是第1组(\d\d)匹配的部分:99
group(2)是第二组(\w+)匹配的那部分SuperJava

注意:括号是可以嵌套的。比如:
匹配:
<img height="663" alt="laixin.jpg" width="500" src="/d/file/jijinhuipindao/gzll/ganenxin/2011-12-22/8c87bacfebf6647f6a348b84 a60401e4.jpg" />
正则:(src|href)="(.*?\.(jpg|gif|bmp|jpeg|png|doc|xsl|rar|zip))"
循环group [0,groupCount]结果是:
0:src="/d/file/jijinhuipindao/gzll/ganenxin/2011-12-22/8c87bacfebf6647f6a348b84 a60401e4.jpg"
1:src
3:/d/file/jijinhuipindao/gzll/ganenxin/2011-12-22/8c87bacfebf6647f6a348b84 a60401e4.jpg
4:jpg
:
下面我们写一个程序来验证一下:
Java代码   收藏代码
  1. package edu.jlu.fuliang;  
  2.   
  3. import java.util.regex.Matcher;  
  4. import java.util.regex.Pattern;  
  5.   
  6.   
  7. public class RegexTest  
  8.     public static void main(String[] args)  
  9.         String regex "\\w(\\d\\d)(\\w+)" 
  10.         String candidate "x99SuperJava" 
  11.           
  12.         Pattern Pattern.compile(regex);  
  13.         Matcher matcher p.matcher(candidate);  
  14.         if(matcher.find()){  
  15.             int gc matcher.groupCount();  
  16.             for(int 0<= gc; i++)  
  17.                 System.out.println("group " :" matcher.group(i));  
  18.          
  19.      
  20.  

输出结果:
引用
group 0 Java正则表达式99SuperJava
group 1 :99
group 2 :SuperJava


下面我们看看Matcher类提供的方法:
public Pattern pattern()
这个方法返回了,创建Matcher的那个pattern对象。
下面我们看看一个小例子来说明这个结果
Java代码   收藏代码
  1. import java.util.regex.*;  
  2.   
  3. public class MatcherPatternExample{  
  4.   public static void main(String args[]){  
  5.       test();  
  6.    
  7.   
  8.   public static void test(){  
  9.      Pattern Pattern.compile("\\d");  
  10.      Matcher m1 p.matcher("55");  
  11.      Matcher m2 p.matcher("fdshfdgdfh");  
  12.   
  13.      System.out.println(m1.pattern() == m2.pattern());  
  14.      //return true  
  15.    
  16.  

public Matcher reset()
这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态,并且将候选字符序列设置为input后进行Matcher,
这个方法和重新创建一个Matcher一样,只是这样可以重用以前的对象。
public int start()
这个方法返回了,Matcher所匹配的字符串在整个字符串的的开始下标:
下面我们看看一个小例子
Java代码   收藏代码
  1. public class MatcherStartExample{  
  2.   public static void main(String args[]){  
  3.       test();  
  4.    
  5.   public static void test(){  
  6.      //create Matcher and use the Matcher.start() method  
  7.      String candidateString "My name is Bond. James Bond." 
  8.      String matchHelper[]  
  9.       {         ^",                     ^"};  
  10.      Pattern Pattern.compile("Bond");  
  11.      Matcher matcher p.matcher(candidateString);  
  12.   
  13.      //Find the starting point of the first 'Bond'  
  14.       matcher.find();  
  15.       int startIndex matcher.start();  
  16.       System.out.println(candidateString);  
  17.       System.out.println(matchHelper[0startIndex);  
  18.   
  19.      //Find the starting point of the second 'Bond'  
  20.       matcher.find();  
  21.       int nextIndex matcher.start();  
  22.       System.out.println(candidateString);  
  23.       System.out.println(matchHelper[1nextIndex);  
  24.  

输出结果:
My name is Bond. James Bond.
                   ^11
My name is Bond. James Bond.
                                           ^23
public int start(int group)
这个方法可以指定你感兴趣的sub group,然后返回sup group匹配的开始位置。
public int end()
这个和start()对应,返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。
其实start和end经常是一起配合使用来返回匹配的子字符串。
public int end(int group)
和public int start(int group)对应,返回在sup group匹配的子字符串最后一个字符在整个字符串下标加一
public String group()
返回由以前匹配操作所匹配的输入子序列。
这个方法提供了强大而方便的工具,他可以等同使用start和end,然后对字符串作substring(start,end)操作。
看看下面一个小例子:
Java代码   收藏代码
  1. import java.util.regex.*;  
  2.   
  3. public class MatcherGroupExample{  
  4.   public static void main(String args[]){  
  5.       test();  
  6.    
  7.   public static void test(){  
  8.       //create Pattern  
  9.       Pattern Pattern.compile("Bond");  
  10.   
  11.       //create Matcher and use the Matcher.group() method  
  12.       String candidateString "My name is Bond. James Bond." 
  13.       Matcher matcher p.matcher(candidateString);  
  14.       //extract the group  
  15.       matcher.find();  
  16.       System.out.println(matcher.group());  
  17.    
  18.  

public String group(int group)
这个方法提供了强大而方便的工具,可以得到指定的group所匹配的输入字符串
应为这两个方法经常使用,同样我们看一个小例子:
Java代码   收藏代码
  1. import java.util.regex.*;  
  2.   
  3. public class MatcherGroupParamExample 
  4.   public static void main(String args[]){  
  5.       test();  
  6.    
  7.   public static void test(){  
  8.      //create Pattern  
  9.       Pattern Pattern.compile("B(ond)");  
  10.   
  11.      //create Matcher and use the Matcher.group(int) method  
  12.      String candidateString "My name is Bond. James Bond." 
  13.      //create helpful index for the sake of output  
  14.      Matcher matcher p.matcher(candidateString);  
  15.      //Find group number of the first find  
  16.       matcher.find();  
  17.       String group_0 matcher.group(0);  
  18.       String group_1 matcher.group(1);  
  19.       System.out.println("Group " group_0);  
  20.       System.out.println("Group " group_1);  
  21.       System.out.println(candidateString);  
  22.   
  23.      //Find group number of the second find  
  24.       matcher.find();  
  25.       group_0 matcher.group(0);  
  26.       group_1 matcher.group(1);  
  27.       System.out.println("Group " group_0);  
  28.       System.out.println("Group " group_1);  
  29.       System.out.println(candidateString);  
  30.    
  31.  


public int groupCount()
这个方法返回了,正则表达式的匹配的组数。
public boolean matches()
尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。
和find不同, find是会在整个输入字符串查找匹配的子字符串。
public boolean find()
find会在整个输入中寻找是否有匹配的子字符串,一般我们使用find的流程:
Java代码   收藏代码
  1. while(matcher.find()){  
  2.    //在匹配的区域,使用group,replace等进行查看和替换操作  
  3.  

public boolean find(int start)
从输入字符串指定的start位置开始查找。
public boolean lookingAt()
基本上是matches更松约束的一个方法,尝试将从区域开头开始的输入序列与该模式匹配
public Matcher appendReplacement (StringBuffer sb, String replacement)
你想把My name is Bond. James Bond. I would like a martini中的Bond换成Smith
Java代码   收藏代码
  1. StringBuffer sb new StringBuffer();  
  2. String replacement "Smith" 
  3. Pattern pattern Pattern.compile("Bond");  
  4. Matcher matcher =pattern.matcher("My name is Bond. James Bond. would like martini.");  
  5. while(matcher.find()){  
  6.   matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith  
  7.  

Matcher对象会维护追加的位置,所以我们才能不断地使用appendReplacement来替换所有的匹配。
public StringBuffer appendTail(StringBuffer sb)
这个方法简单的把为匹配的结尾追加到StringBuffer中。在上一个例子的最后再加上一句:
matcher.appendTail(sb);
结果就会成为My name is Smith. James Smith. I would like a martini.
public String replaceAll(String replacement)
这个是一个更方便的方法,如果我们想替换所有的匹配的话,我们可以简单的使用replaceAll就ok了。
是:
Java代码   收藏代码
  1. while(matcher.find()){  
  2.   matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith  
  3.  
  4. matcher.appendTail(sb);  

的更便捷的方法。
Java代码   收藏代码
  1. public String replaceFirst(String replacement)  

这个与replaceAll想对应很容易理解,就是只替换第一个匹配的。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值