正则表达式在java中使用(regtheory)

酒吧纯情男高

已于 2023-05-16 15:49:32 修改

阅读量77

点赞数 2

文章标签： java 正则表达式 jvm

于 2023-05-10 23:13:35 首次发布

本文链接：https://blog.csdn.net/m0_63081421/article/details/130611979

版权

代码使用

头文件声明

import java.util.regex.Matcher;
import java.util.regex.Pattern;

具体使用方法

String s ="62671-ashdhh";
String regStr = "^[0-9]+\\-[a-z]+$";
Pattern p = Pattern.compile(regStr);
Matcher m = p.matcher(s);
//boolean b = m.matches();
while (m.find()) {
    System.out.println("找到 " + m.group(0));
}

上面的使用太繁琐，一般使用场景我们只需要匹配检查一次即可。所以可以省略为如下方式

boolean b = Pattern.matches("a*b", "aaaaab"); //reg,str

上面那样普通使用还是麻烦，因此在字符串对象里提供快速调用的方法

"aaaaab".matches("a*b")

字符串matches和Pattern.matches的源码，可以发现其实内部还是用了第一种方式的

常见的操作

匹配

String matches（）方法。用规则匹配整个字符串，只要有一处不符合规则，就匹配结束，返回false。

String str = "123a45664";

String reg = "[1-9]\\d{4,14}";

boolean flag = str.matches(reg);
if(flag)
	System.out.println(qq+"...is ok");
else
	System.out.println(qq+"...is no ok");

切割

String split（）方法; 根据给定正则表达式的匹配拆分此字符串。返回一个数组。

		String str = "avg   bb   geig   glsd   abc";
        String reg = " +";//按照多个空格来进行切割
        
        String[] arr = str.split(reg);  
        System.out.println(arr.length);
        for(String s : arr){
            System.out.println(s);
        }

替换

String replaceAll(regex,str) 方法; 使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。

String str = "wer1389980000ty1234564uiod234345675f";//将字符串中的数字替换成#。
str = str.replaceAll("\\d{5,}","#");

System.out.println(str);
// wer#ty#uio#f

public static void replaceAllDemo(){
    
        String str1 = "erkktyqqquizzzzzo";//将叠词替换成$.  //将重叠的字符替换成单个字母。zzzz->z
 
        str = str.replaceAll("(.)\\1+","$1");$1引用前面.

        System.out.println(str);
}
        // erktyquizo

常见的符号的介绍

`符号`	说明
`.`	任何字符（与行结束符可能匹配也可能不匹配）
`\d`	数字：`[0-9]`
`\D`	非数字： `[^0-9]`
`\s`	空白字符：`[ \t\n\x0B\f\r]`
`\S`	非空白字符：`[^\s]`
`\w`	单词字符：`[a-zA-Z_0-9]`
`\W`	非单词字符：`[^\w]`
`\`	转义字符，比如"\“匹配”" ,“{“匹配”{”。

符号	说明
*	等价于｛0，｝匹配0至多个在它之前的字符。例如正则表达式“zo”能匹配“z”以及“zoo”；正则表达式“.”意味着能够匹配任意字符串。
+	等价于｛1，｝匹配前面的子表达式一次或多次。例如正则表达式9+匹配9、99、999等。
?	等价于｛0，1｝匹配前面的子表达式零次或一次。例如，“do(es)?” 可以匹配 “do” 或 “does” 中的"do" 。此元字符还有另外一个用途，就是表示非贪婪模式匹配，后边将有介绍
{n}	匹配确定的 n 次。例如，“e{2}”不能匹配“bed”中的“d”，但是能匹配“seed”中的两个“e”。
{n,}	至少匹配n次。例如，“e{2,}”不能匹配“bed”中的“e”，但能匹配“seeeeeeeed”中的所有“e”。
{n,m}	最少匹配 n 次且最多匹配 m 次。“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。

`符号`	说明
`^`	行的开头
`$`	行的结尾
`\b`	单词边界
`\B`	非单词边界
`\A`	输入的开头
`\G`	上一个匹配的结尾
`\Z`	输入的结尾，仅用于最后的结束符（如果有的话）
`\z`	输入的结尾

`[]的使用--或`	`说明`
`[]`	匹配括号中的任何一个字符
`[abc]`	`a`、`b` 或 `c`（简单类）
`[^abc]`	任何字符，除了 `a`、`b` 或 `c`（否定）
`[a-zA-Z]`	`a` 到 `z` 或 `A` 到 `Z`，两头的字母包括在内（范围）
`[a-d[m-p]]`	`a` 到 `d` 或 `m` 到 `p`：`[a-dm-p]`（并集）
`[a-z&&[def]]`	`d`、`e` 或 `f`（交集）
`[a-z&&[^bc]]`	`a` 到 `z`，除了 `b` 和 `c`：`[ad-z]`（减去）
`[a-z&&[^m-p]]`	`a` 到 `z`，而非 `m` 到 `p`：`[a-lq-z]`（减去）
`（）的使用 -- 组`
（）	将 () 之间括起来的表达式定义为“组”(group)，并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。捕获组可以通过从左到右计算其开括号来编号。
(\d)	第一组
`((A)(B(C)))`	第一组 ((A)(B©)) 第二组 (A) 第三组(B©) 第四组©

[a-z]指的范围在a-z
[a-z]{6}6位a-z范围的值
[a-z]*不限制长度范围

酒吧纯情男高

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
正则表达式在java中使用(regtheory)

符号说明任何字符（与行结束符可能匹配也可能不匹配）\d[0-9]\D非数字：[^0-9]\s\S[^\s]\w\W[^\w]转义字符，比如"\“匹配”" ,“{“匹配”{”。符号说明等价于｛0，｝匹配0至多个在它之前的字符。例如正则表达式“zo*”能匹配“z”以及“zoo”；正则表达式“.*”意味着能够匹配任意字符串。等价于｛1，｝匹配前面的子表达式一次或多次。例如正则表达式9+匹配9、99、999等。?等价于｛0，1｝匹配前面的子表达式零次或一次。
复制链接

扫一扫