正则表达式

最新推荐文章于 2023-09-28 11:57:09 发布

rootkiss

最新推荐文章于 2023-09-28 11:57:09 发布

阅读量264

点赞数

分类专栏：前端

本文链接：https://blog.csdn.net/rootkiss/article/details/99304222

版权

前端专栏收录该内容

1 篇文章 0 订阅

订阅专栏

中文正则表达式匹配-正则中文匹配

正则表达式中的小括号"()"。是代表分组的意思。如果再其后面出现\1则是代表与第一个小括号中要匹配的内容相同。注意：\1必须与小括号配合使用

\1 \2

String string="sdfffdsjjcvnnnnnfkkk";
String regex="(.)\\1+";
String[] strings=string.split(regex);
for (int i = 0; i < strings.length; i++) {
	System.out.print(strings[i]);
}

在这里插入图片描述

String string="sdfffdsjjcvnnnnnfkkk";
String regex="(.)\\1";
String[] strings=string.split(regex);
for (int i = 0; i < strings.length; i++) {
	System.out.print(strings[i]);
}

在这里插入图片描述

String regex="(...)\\1";
String string="abcabcacb";
 String nString=string.replaceAll(regex, "");
 System.out.println(nString);

在这里插入图片描述

前面用括号捕获了一个子匹配，斜杠数字就表示和子匹配一样的内容，第一个子匹配就是\1，第二就是\2。

(?<=<(\w+)>).*(?=<\/\1>)

正则表达式看懂的最好方法就是一步步分开解析：

1）以 .*为分界，前面括号中的内容可以划分为 ？<=和 <(\w+)>,其中<(\w+)>表示匹配尖括号里面是字母、数字或下划线的内容[a-zA-Z_0-9]，类似，外面还要加个括号是要实现分组；而？<=用到的是零宽断言语法，表示的是断定<(\w+)>后面有或没有内容，而且与内容的间隔宽度为零。

2）再看 .* 后面的部分，括号里面的内容可以分为 ‘？=’ 和 ‘<(\/\1>’,其中‘？=’用零宽断言表示匹配‘<(\/\1>’前面的部分，而对于‘<(\/\1>’，\/匹配/符号，类似,这里可能有些同学不太明白‘\1’是什么意思？这里用到的是捕获分组的思想，上述提到的‘<(\w+)>’外面加个小括号就表示一个分组，对于正则表达式的分组结果，索引 0表示匹配的整个内容，而1表示的是第1个子分组，所以这里的'\1'指向的就是前面的第一个分组‘<(\w+)>’，\2表示重复第2个子项，\n表示重复第n个子项；

3）.* 就比较简单了，表示的是匹配除了换行符意外的任意字符0次或多次。

综上，改表达式匹配的是类似html标签这种内容的，如<body>你好，正则！</body>
参考：请问这个「 (?<=<(\w+)>).*(?=</\1>) 」正则表达式是什么意思呢？

$1

String string="哇哇哇哇哇哇哇哇烦烦烦方法水水水水";
String string2=string.replaceAll("(.)\\1+", "$1");
System.out.println(string2);

在这里插入图片描述

$1,$2…是表示的小括号里的内容
$1是第一个小括号里的 ,$2是第2个小括号里的
比如 /gai([\w]+?)over([\d]+)/
匹配 gainover123
$1= 括号里的 n
$2= 第2个括号里的 123

Pattern Matcher

public static void main(String[] args) {
		String string="我的手机号18837489098，13488379，12374638965";
		String regex="1[2387]\\d{9}";
		
		Pattern p=Pattern.compile(regex);
		Matcher m=p.matcher(string);
		while (m.find()) {//必须先find才能group
			System.out.println(m.group());
		}