捕获组
捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。
例如,正则表达式 (dog) 创建了单一分组,组里包含"d",“o”,和"g"。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
- ((A)(B( C)))
- (A)
- (B( C))
- ( C)
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。
还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。
另外,java中\\
代表一个\
,所以\\\\
表示\\
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexMatches
{
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(\\D*)(\\d+)(.*)";
// 创建 Pattern 对象
Pattern r = Pattern.compile(pattern);
// 现在创建 matcher 对象
Matcher m = r.matcher(line);
m.matches();
// m.lookingAt() 尝试将从区域开头开始的输入序列与该模式匹配。
// m.matches() 尝试将整个区域与模式匹配。
// 二者都返回布尔类型
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) );
} else {
System.out.println("NO MATCH");
}
}
}
字符 | 说明 |
---|---|
^ | 匹配字符串开始的位置 |
$ | 匹配字符串结尾的位置 |
* | 零次或多次匹配前面的字符或子表达式 |
+ | 一次或多次匹配前面的字符或子表达式 |
? | 零次或一次匹配前面的字符或子表达式 |
{n} | n 是非负整数。正好匹配 n 次 |
{n,} | n 是非负整数。至少匹配 n 次 |
{n,m} | m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次 |
? | 当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。例如,在字符串"oooo"中,"o+?“只匹配单个"o”,而"o+“匹配所有"o” |
. | 匹配除"\r\n"之外的任何单个字符 |
x|y | 匹配 x 或 y |
[abc] | 字符集。匹配包含的任一字符。例如,"[abc]“匹配"plain"中的"a” |
[^abc] | 反向字符集。匹配未包含的任何字符。例如,"[^abc]“匹配"plain"中"p”,“l”,“i”,“n” |
[a-z] | 字符范围。匹配指定范围内的任何字符 |
[^a-z] | 反向范围字符。匹配不在指定的范围内的任何字符。例如,"[^a-z]"匹配任何不在"a"到"z"范围内的任何字符。 |
\d | 数字字符匹配,等效于 [0-9] |
\D | 非数字字符匹配 |