正则表达式在java中使用(regtheory)

代码使用

  • 头文件声明
import java.util.regex.Matcher;
import java.util.regex.Pattern;
  • 具体使用方法
String s ="62671-ashdhh";
String regStr = "^[0-9]+\\-[a-z]+$";
Pattern p = Pattern.compile(regStr);
Matcher m = p.matcher(s);
//boolean b = m.matches();
while (m.find()) {
    System.out.println("找到 " + m.group(0));
}
  • 上面的使用太繁琐,一般使用场景我们只需要匹配检查一次即可。所以可以省略为如下方式
boolean b = Pattern.matches("a*b", "aaaaab"); //reg,str
  • 上面那样普通使用还是麻烦,因此在字符串对象里提供快速调用的方法
"aaaaab".matches("a*b")

字符串matches和Pattern.matches的源码,可以发现其实内部还是用了第一种方式的

常见的操作

  • 匹配

    String matches()方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。

    String str = "123a45664";
    
    String reg = "[1-9]\\d{4,14}";
    
    boolean flag = str.matches(reg);
    if(flag)
    	System.out.println(qq+"...is ok");
    else
    	System.out.println(qq+"...is no ok");
    
  • 切割

    String split()方法; 根据给定正则表达式的匹配拆分此字符串。返回一个数组。

    		String str = "avg   bb   geig   glsd   abc";
            String reg = " +";//按照多个空格来进行切割
            
            String[] arr = str.split(reg);  
            System.out.println(arr.length);
            for(String s : arr){
                System.out.println(s);
            }
    
  • 替换

    String replaceAll(regex,str) 方法; 使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。

    String str = "wer1389980000ty1234564uiod234345675f";//将字符串中的数字替换成#。
    str = str.replaceAll("\\d{5,}","#");
    
    System.out.println(str);
    // wer#ty#uio#f
    
    public static void replaceAllDemo(){
        
            String str1 = "erkktyqqquizzzzzo";//将叠词替换成$.  //将重叠的字符替换成单个字母。zzzz->z
     
            str = str.replaceAll("(.)\\1+","$1");$1引用前面.
    
            System.out.println(str);
    }
            // erktyquizo
    

常见的符号的介绍

符号说明
.任何字符(与行结束符可能匹配也可能不匹配)
\d数字:[0-9]
\D非数字: [^0-9]
\s空白字符:[ \t\n\x0B\f\r]
\S非空白字符:[^\s]
\w单词字符:[a-zA-Z_0-9]
\W非单词字符:[^\w]
\转义字符,比如"\“匹配”" ,“{“匹配”{”。
符号说明
*等价于{0,} 匹配0至 多个 在它之前的字符。例如正则表达式“zo*”能匹配“z”以及“zoo”;正则表达式“.*”意味着能够匹配任意字符串。
+等价于{1,} 匹配前面的子表达式一次或多次。例如正则表达式9+匹配9、99、999等。
?等价于{0,1} 匹配前面的子表达式零次或一次。例如,“do(es)?” 可以匹配 “do” 或 “does” 中的"do" 。此元字符还有另外一个用途,就是表示非贪婪模式匹配,后边将有介绍
{n}匹配确定的 n 次。例如,“e{2}”不能匹配“bed”中的“d”,但是能匹配“seed”中的两个“e”。
{n,}至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配“seeeeeeeed”中的所有“e”。
{n,m}最少匹配 n 次且最多匹配 m 次。“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。
符号说明
^行的开头
$行的结尾
\b单词边界
\B非单词边界
\A输入的开头
\G上一个匹配的结尾
\Z输入的结尾,仅用于最后的结束符(如果有的话)
\z输入的结尾
[]的使用--或 说明
[] 匹配括号中的任何一个字符
[abc]abc(简单类)
[^abc]任何字符,除了 abc(否定)
[a-zA-Z]azAZ,两头的字母包括在内(范围)
[a-d[m-p]]admp[a-dm-p](并集)
[a-z&&[def]]def(交集)
[a-z&&[^bc]]az,除了 bc[ad-z](减去)
[a-z&&[^m-p]]az,而非 mp[a-lq-z](减去)
()的使用 -- 组
()将 () 之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。捕获组可以通过从左到右计算其开括号来编号。
(\d)第一组
((A)(B(C)))第一组 ((A)(B©)) 第二组 (A) 第三组(B©) 第四组©

[a-z]指的范围在a-z
[a-z]{6}6位a-z范围的值
[a-z]*不限制长度范围

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值