java 正则表达式分类功能_Java 正则表达式捕获组分类

导读

什么是捕获组?简单点说,捕获组就是把(Expression)中匹配到的内容保存到一个按“(”出现的顺序编号的组里,以供后续引用,引用的方式有反向引用,或是RegExp.Snumber等方式,不同的语言,支持的引用方式不同。

19dbf71d486d7014afaf97c865640b0e.png

Java 正则表达式的捕获组分为:

普通捕获组(Expression)

命名捕获组(?Expression)

普通捕获组

从正则表达式左侧开始,每出现一个左括号"("记做一个分组,分组编号从 1 开始。0 代表整个表达式。

对于时间字符串:2017-04-25,表达式如下

(\\d{4})-((\\d{2})-(\\d{2}))

有 4 个左括号,所以有 4 个分组:

编号

捕获组

匹配

0

(\d{4})-((\d{2})-(\d{2}))

2017-04-25

1

(\d{4})

2017

2

((\d{2})-(\d{2}))

04-25

3

(\d{2})

04

4

(\d{2})

25

public static final String DATE_STRING = "2017-04-25";

public static final String P_COMM = "(\\d{4})-((\\d{2})-(\\d{2}))";

Pattern pattern = Pattern.compile(P_COMM);

Matcher matcher = pattern.matcher(DATE_STRING);

matcher.find();//必须要有这句

System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));

System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1));

System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2));

System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3));

System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));

命名捕获组

每个以左括号开始的捕获组,都紧跟着 ?,而后才是正则表达式。

对于时间字符串:2017-04-25,表达式如下:

(?\\d{4})-(?(?\\d{2})-(?\\d{2}))

有 4 个命名的捕获组,分别是:

编号

名称

捕获组

匹配

0

0

(?\d{4})-(?(?\d{2})-(?\d{2}))

2017-04-25

1

year

(?\d{4})-

2017

2

md

(?(?\d{2})-(?\d{2}))

04-25

3

month

(?\d{2})

04

4

date

(?\d{2})

25

命名的捕获组同样也可以使用编号获取相应值。

public static final String P_NAMED = "(?\\d{4})-(?(?\\d{2})-(?\\d{2}))";

public static final String DATE_STRING = "2017-04-25";

Pattern pattern = Pattern.compile(P_NAMED);

Matcher matcher = pattern.matcher(DATE_STRING);

matcher.find();

System.out.printf("\n===========使用名称获取=============");

System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));

System.out.printf("\n matcher.group('year') value:%s", matcher.group("year"));

System.out.printf("\nmatcher.group('md') value:%s", matcher.group("md"));

System.out.printf("\nmatcher.group('month') value:%s", matcher.group("month"));

System.out.printf("\nmatcher.group('date') value:%s", matcher.group("date"));

matcher.reset();

System.out.printf("\n===========使用编号获取=============");

matcher.find();

System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));

System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1));

System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2));

System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3));

System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));

PS:非捕获组

在左括号后紧跟 ?:,而后再加上正则表达式,构成非捕获组 (?:Expression)。

对于时间字符串:2017-04-25,表达式如下:

(?:\\d{4})-((\\d{2})-(\\d{2}))

这个正则表达式虽然有四个左括号,理论上有 4 个捕获组。但是第一组 (?:\d{4}),其实是被忽略的。当使用 matcher.group(4) 时,系统会报错。

编号

捕获组

匹配

0

(\d{4})-((\d{2})-(\d{2}))

2017-04-25

1

((\d{2})-(\d{2}))

04-25

2

(\d{2})

04

3

(\d{2})

25

总结

普通捕获组使用方便;

命名捕获组使用清晰;

非捕获组目前在项目中还没有用武之地。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值