java正则表达式中自己对捕获组的初步理解

最新推荐文章于 2024-05-23 11:53:35 发布

kylezhou1992

最新推荐文章于 2024-05-23 11:53:35 发布

阅读量798

点赞数 1

一、捕获组的概念：

捕获组是把多个字符当一个单独单元进行处理的方法，它通过对括号内的字符分组来创建。根据的自己的需求，用小括号()，将一段正则表达式划分成不同的部分，默认次序一般是从左到右（PS：必须注意普通捕获组和命名捕获组的区别）。

举例：

表达式 "(x)(y\\w*)(z)" 中，存在四个这样的组：
分组0.(x)(y\\w*)(z) //一般原组默认为分组0
分组1. x
分组2. y\\w*
分组3. z

捕获的子序列稍后可以通过 Back 引用在表达式中使用，也可以在匹配操作完成后从匹配器获取。

以 (?) 开头的组是纯的非捕获组，它不捕获文本，也不针对组合计进行计数。

三.back引用: \n

检查字符类重复是采用正则表达式的向后扫描来处理来处理。圆括号在正则表达式中有几种不同的用法，一个就是能提供组合类型，组合类型用来保存所匹配的结果或部分匹配的结果(以便后面能用到)，即使遇到有相同的模式。在同样的正则表达中，可能(也通常期望)不止有一个组合类型。在第n个组合类型中匹配结果可以通过向后扫描来获取到。向后扫描使得搜索重复的单词非常简单:\b(\w+)\s+\1\b，如"go go"或"kitty kitty"。(\1表示组1匹配的文本，如go或kitty)

后向引用用于重复搜索前面某个分组匹配的文本，back引用的是同个字符串中的前面捕获组。例如，\1代表分组1匹配的文本。难以理解？请看示例：
\b(\w+)\b\s+\1\b可以用来匹配重复的单词，像"go go", 或者"kitty kitty"。
这个表达式首先是一个单词，也就是单词开始处和结束处之间的多于一个的字母或数字(\b(\w+)\b)，这个单词会被捕获到编号为1的分组中，然后是1个或几个空白符(\s+)，最后是分组1中捕获的内容（也就是前面匹配的那个单词）(\1)。

你也可以自己指定子表达式的组名。要指定一个子表达式的组名，请使用这样的语法：(?<Word>\w+)(或者把尖括号换成'也行：(?'Word'\w+)),这样就把\w+的组名指定为Word了。要反向引用这个分组捕获的内容，你可以使用\k<Word>,所以上一个例子也可以写成这样：\b(?<Word>\w+)\b\s+\k<Word>\b。

四：在另一个字符串引用捕获组的内容的方法("$")：

class  RegexDemo  
{  
public static void main(String[] args)   
{  
  
String str = "wer1389980000ty1234564uiod234345675f";//将字符串中的数组替换成#。  
String str1 = "erkktyqqquizzzzzo";//将重叠的字符替换成单个字母。zzzz->z  
replaceAllDemo(str1,"(.)\\1+","$1");//"$1"表示捕获组1，依次类推，"$2"表示第二捕获组  
  
}  
public static void replaceAllDemo(String str,String reg,String newStr)  
{  
str = str.replaceAll(reg,newStr);  
System.out.println(str);  
}  
}

内容出处：http://blog.csdn.net/u014782692/article/details/50545755

kylezhou1992

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java正则表达式中自己对捕获组的初步理解

一、捕获组的概念：捕获组是把多个字符当一个单独单元进行处理的方法，它通过对括号内的字符分组来创建。根据的自己的需求，用小括号()，将一段正则表达式划分成不同的部分，默认次序一般是从左到右（PS：必须注意普通捕获组和命名捕获组的区别）。举例：表达式 "(x)(y\\w*)(z)" 中，存在四个这样的组：分组0.(x)(y\\w*)(z) //一
复制链接

扫一扫