正则表达式捕获组与反向引用
-
反向引用(\nnn)
每一对()会分配一个编号,使用 () 的捕获根据左括号的顺序从 1 开始自动编号。
通过反向引用,可以对分组已捕获的字符串进行引用。 -
|的使用
说明:|表示或的关系,aa|bb表示可以匹配aa或bb
aa|bb
- ()的使用
说明:()表示分组,顺序是从外到里,从左到右。
分组从1开始,0默认代表全部匹配的文本
例:(a(b))
分组1: (a(b)) 分组2:(b)
例2:下面图片也是一个分组
// 创建 Pattern 对象
Pattern r = Pattern.compile("(go(to))");
// 现在创建 matcher 对象
Matcher m = r.matcher("goto to go ");
System.out.println(m.groupCount());
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
}
--------------
2
Found value: goto
Found value: goto
Found value: to
- (?:)的使用
()捕获组会保存内容,大量捕获组保存内容可能会对性能造成影响,若不需要保存内容的时候,可以选择使用非捕获组(?: )
// 创建 Pattern 对象
Pattern r = Pattern.compile("(?:goto.*)");
// 现在创建 matcher 对象
Matcher m = r.matcher("goto to go ");
System.out.println(m.matches());
System.out.println(m.group(1)); //此时会报错,因为非捕获组不保存内容,所以获取时会报错
- 反向引用的使用
反向引用,例:\1,\2等
\1:表示的是引用第一次匹配到的()括起来的部分
\2:表示的是引用第二次匹配到的()括起来的部分
例1:String regex="(\\d)\\1";
此正则会匹配上11,22,33,44.等重复数字,首先(\\d)匹配上一个数字,然后\1对第一个分组进行引用,所以匹配到的是重复数字
例2:String regex = "^(\\d)\\1[0-9](\d)\1{2}";
此正则可以匹配114711
说明:首先第一个分组\d匹配一位数字, 然后\1反向引用第一个分组的结果即1,[0-9]匹配上4,第二个分组\d匹配上7,最后的\d仍然反向引用第一个分组的结果即1且重复两次