今天在使用正则匹配的过程中,有如下这样几个函数:
没有使用过,也没有了解过,抱着一颗求知的心,看了看相关的博客,有那么一点理解,但不是完全消化,就多查找了相关知识点做了一个整合,希望能帮到一样有疑惑的你们。奥利给!
想要弄清这几个方法,首先要弄清Java正则表达式中的捕获组的概念。
捕获组
捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。
例如,正则表达式 (smile) 创建了单一分组,组里包含"s",“m”,“i”,“l” 和 “e”。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
- ( ( A ) ( B ( C ) ) )
- ( A )
- ( B ( C ) )
- ( C )
接下来我们来看看博文一开始地图片上的几个方法。
group()、group(i)、groupCount()
如果要使用,我们需通过调用matcher对象的这几种方法。
-
public String group():返回由以前匹配操作所匹配的输入子序列。 对于具有输入序列 s 的匹配器 m,表达式 m.group() 和 s.substring(m.start(), m.end()) 是等效的。
-
public String group(int i):返回上次匹配操作的某个group。如果匹配成功,但是没能找到group,则返回null。
【注意】
:由于捕获组是从 1 开始从左到右的索引,因此表达式 m.group(0) 等效于 m.group()。 即:group(0))是一个特殊的组,它总是代表整个表达式。该组不包括在 groupCount 的返回值中。
-
public int groupCount(): 查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。
举个例子【菜鸟教程中的】
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexMatches
{
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(\\D*)(\\d+)(.*)";
// 创建 Pattern 对象
Pattern r = Pattern.compile(pattern);
// 现在创建 matcher 对象
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) );
} else {
System.out.println("NO MATCH");
}
}
}
以上实例编译运行结果如下:
Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT
Found value: 3000
Found value: ! OK?