正则表达式捕获Java中的组和反向引用

xiaozaq

已于 2022-05-18 15:47:46 修改

阅读量370

点赞数 1

分类专栏：正则表达式总结文章标签：正则表达式 java 去重

于 2022-04-19 17:53:49 首次发布

本文链接：https://blog.csdn.net/xiaozaq/article/details/124279359

版权

总结同时被 2 个专栏收录

88 篇文章 3 订阅

订阅专栏

正则表达式

10 篇文章 1 订阅

订阅专栏

捕获组是一种将多个字符视为一个单元的方法。通过将要分组的字符放在一组括号内来创建它们。例如，正则表达式（狗）创建一个包含字母“ d”，“ o”和“ g”的单个组。

捕获组通过从左到右计数其开括号来编号。例如，在表达式（(A)（B(C)））中，有四个这样的组。

((A)(B(C)))
(A)
(B(C))
(C)

现在有个需求是去除文章中重复的“<br/>”换行标签，希望只保留一个换行标签。

public static void main(String[] args) throws Exception {

		String str = "&nbsp;&nbsp;文章第一段文章第一段文章第一段文章第一段文章第一段。<br><br><br><br>&nbsp;&nbsp;文章第二段文章第二段文章第二段文章第二段文章第二段<br><br><br><br>&nbsp;&nbsp;文章第三段文章第三段文章第三段文章第三段文章第三段<br>";
		str = str.replaceAll("(\\s*<br\\s*/?>\\s*)\\1+", "\n<br/>\n");
		System.out.println(str);
	}

运行结果：

&nbsp;&nbsp;文章第一段文章第一段文章第一段文章第一段文章第一段。
<br/>
&nbsp;&nbsp;文章第二段文章第二段文章第二段文章第二段文章第二段
<br/>
&nbsp;&nbsp;文章第三段文章第三段文章第三段文章第三段文章第三段<br>

总结：

1.反向引用指的就是“\\1” 他表示前面括号里的捕获组，数字1表示第一个捕获组。然后后面接+号，表示至少出现1次。加上前面括号的捕获组，即至少出现2次。

2.理解上面的含义就明白为什么运行结果中最后一个换行标签没被替换了。

因为是+号，所以必须出现2次才会进行替换的。

另外还可以在替换字符串中使用捕获组，与前面的“\\1”区别是，使用“$1”指代捕获组。例子：

System.out.println("123456789".replaceAll("(4)5(6)", "<p>$1</p>"));

输出结果是：

123<p>4</p>789

xiaozaq

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
正则表达式捕获Java中的组和反向引用

捕获组是一种将多个字符视为一个单元的方法。通过将要分组的字符放在一组括号内来创建它们。例如，正则表达式（狗）创建一个包含字母“ d”，“ o”和“ g”的单个组。捕获组通过从左到右计数其开括号来编号。例如，在表达式（(A)（B(C)））中，有四个这样的组。((A)(B(C)))(A)(B(C))(C)现在有个需求是去除文章中重复的“<br/>”换行标签，希望只保留一个换行标签。public static void main(String[] args) throws E
复制链接

扫一扫