【JAVASE】正则表达式常用类以及matches与find区别

Pattern类

pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
格式:

Pattern pattern=Pattern.compile(reg);

其中pattern为Pattern类对象,reg为正则表达式(字符串)

matches

matches方法:Pattern类的一个成员方法,用于整体匹配
若有匹配项,返回true,无则返回false

格式:

boolean isMatch=Pattern.matches(reg,content);

其中isMatch表示是否匹配,reg为正则表达式(字符串),content为原字符串

import java.util.regex.*;
 
class RegexExample1{
   public static void main(String[] args){
      String content = "I am noob " +
        "from runoob.com.";
 
      String pattern = ".*runoob.*";
 
      boolean isMatch = Pattern.matches(pattern, content);
      System.out.println("字符串中是否包含了 'runoob' 子字符串? " + isMatch);//True
   }
}

Matcher 类:

Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
格式:

Matcher m=pattern.matcher(content);

其中m为Matcher类对象,pattern为上述Pattern类对象,content为原字符串

matches

用于整体匹配,即便位于find或者matches后还是会进行重新匹配

格式:

boolean isMatch=matcher.matches();

其中,matcher为Matcher类的对象,返回一个布尔值,表示是否匹配

package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="12312\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		System.out.println(matcher.matches());
		System.out.println(matcher.start());
		System.out.println(matcher.end());
	}
	
}

true
0
6

为什么说是整体匹配呢,上面就是意思,即regString可以匹配到整个string,或者说,通过regString匹配到的字符串就是string而不是string的一部分。
下面可以看一个反例

package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="1231\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		System.out.println(matcher.matches());
		
	}
	
}

false

可以看出来matches的整体匹配的意思,这是与find不同之处

find

格式:

boolean isFind=matcher.find();

matcher为Matcher的对象,返回值为布尔值。

find进行逐个匹配,即复合匹配表达式的就会进行一次匹配,这是与matches不同的一点。
另外一个不同点见find源码:

public boolean find() {
    int nextSearchIndex = last;
    if (nextSearchIndex == first)
        nextSearchIndex++;
 
    // If next search starts before region, start it at region
    if (nextSearchIndex < from)
        nextSearchIndex = from;
 
    // If next search starts beyond region then it fails
    if (nextSearchIndex > to) {
        for (int i = 0; i < groups.length; i++)
            groups[i] = -1;
        return false;
    }
    return search(nextSearchIndex);
}

可以注意到,nextSearchIndex=last,这也就是为什么find是进行逐个匹配的原因,而如果使用matches,可以通过上面matches匹配成功时,matcher.end()=6,即last=6,故若是find在matches之后则无法进行匹配,如下:

package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="12312\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		System.out.println(matcher.matches());
		System.out.println(matcher.start());
		System.out.println(matcher.end());
		System.out.println(matcher.find());
	}
	
}

true
0
6
false
package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="1\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		int i=0;
		while(matcher.find())
		{
			System.out.println("第"+i+"组");
			System.out.println(matcher.start());
			System.out.println(matcher.end());
			System.out.println(matcher.group());
			i++;
			
		}
		
		System.out.println(matcher.find());
	}
}

第0组
0
2
12
第1组
3
5
12
false

而matches则每次调用都会进行重新匹配,如下:

package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

import javax.crypto.Mac;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="12312\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		int i=0;
		while(matcher.find())
		{
			System.out.println("第"+i+"组");
			System.out.println(matcher.start());
			System.out.println(matcher.end());
			System.out.println(matcher.group());
			i++;
			
		}
		System.out.println(matcher.matches());
		System.out.println(matcher.matches());
	}
}

第0组
0
6
123121
true
true

replaceAll

为Matcher类的成员方法,替换所有匹配到的字符串,返回替换后的字符串
格式:

String newContent=matcher.replaceAll(replaceStr);

其中replaceStr为替换的字符串

package Lab6;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_1 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="123121";
		String regString="1\\d";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		int i=0;
		while(matcher.find())
		{
			System.out.println("第"+i+"组");
			System.out.println(matcher.start());
			System.out.println(matcher.end());
			System.out.println(matcher.group());
			i++;
			
		}
		String newcontent=matcher.replaceAll("是");
		System.out.println(newcontent);
	}
}
第0组
0
2
12
第1组
3
5
12
是3是1

start/end

只有匹配成功才会返回匹配的start和end
start:返回匹配到的字符串的第一个字符索引
end:返回匹配到的字符串的最后一个字符索引的下一项
即范围是包括start,不包括end即:[start,end)

package Lab6;

import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Lab6_2 {

	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String string="姓名:捏,电话号:123;邮箱:12312@qq.com;姓名:王,电话号:3232;邮箱:hjdfj@qsa.com";
		String regString="电话号:\\d+";
		Pattern rPattern=Pattern.compile(regString);
		Matcher matcher=rPattern.matcher(string);
		
		
		if (matcher.find()) {
			System.out.println(matcher.start());
			System.out.println(matcher.end());
			System.out.println(matcher.group());
			
		}else {
			System.out.println("不符合!");
		}
	}
	
}

5
12
电话号:123

捕获组

捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。

例如,正则表达式 (dog) 创建了单一分组,组里包含"d",“o”,和"g"。

捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:

((A)(B(C )))
(A)
(B(C ))
(C )
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。

还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。

import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class RegexMatches
{
    public static void main( String[] args ){
 
      // 按指定模式在字符串查找
      String line = "This order was placed for QT3000! OK?";
      String pattern = "(\\D*)(\\d+)(.*)";
 
      // 创建 Pattern 对象
      Pattern r = Pattern.compile(pattern);
 
      // 现在创建 matcher 对象
      Matcher m = r.matcher(line);
      if (m.find( )) {//若找到匹配项
         System.out.println("Found value: " + m.group(0) );//输出整个表达式的组
         System.out.println("Found value: " + m.group(1) );//输出分组1,即(\\D*)
         System.out.println("Found value: " + m.group(2) );//输出分组2,即(\\d+)
         System.out.println("Found value: " + m.group(3) ); //输出分组3,即(.*)
      } else {
         System.out.println("NO MATCH");
      }
   }
}

参考文献

https://blog.csdn.net/qq_44835120/article/details/117606305?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166530202216782425189913%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=166530202216782425189913&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2alltop_click~default-4-117606305-null-null.142v52pc_rank_34_1,201v3control_1&utm_term=java%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F&spm=1018.2226.3001.4187

https://www.runoob.com/java/java-regular-expressions.html

https://blog.csdn.net/qq_39860002/article/details/105479301

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LenckCuak

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值