前面虽然都介绍了正则的一些字符表示含义,这篇正式开始介绍和正则相关的两个Java类对象:Pattern和Matcher。这篇先来了解这两个类的基本概述和简单使用方法。
打开API,搜索并找到Pattern这个类,可以看到模式和匹配器的描述,而且出现了典型的调用顺序。
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
boolean b = m.matches();
下面我们来在Eclipse上写这个代码来运行一下,然后去理解每行代码的基本意思和作用。
package regex;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Demo2_Regex {
public static void main(String[] args) {
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
booleanb = m.matches();
System.out.println(b);
}
}
运行输出是:true
分析一下,我们知道,在正则中*表示出现0次到多次,所以“a*b”这个正则匹配的,就是像“aaab”这样的字符串,上面的输出true是对的。第一行代码,Pattern.compile("a*b")的作用是获取到正则表达式;p.matcher("aaaaab")的作用是获取匹配器;m.matches()是看是否匹配,匹配就返回true。Pattern就是一个模式,Matcher就是一个匹配器。
其实上面的代码,用前面学习的知识完全可以这样的代码去实现。
package regex;
public classDemo2_Regex {
public static void main(String[] args) {
String regex = "a*b";
System.out.println("aaaab".matches(regex));
}
}
第二种方式,看起来更简单,一行代码就可以实现。为什么要使用Pattern和Matcher类的方法呢?答案当然是Pattern和Matcher的方式更加功能强大和便利。下面通过一个例子来了解Pattern和Mactcher的获取功能。
题目:在一个长字符串中国,找出所有的手机号码。
package regex;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Demo2_Regex {
public static void main(String[] args) {
// 找出以下字符串中所有的手机号码
String s = "小明的手机号码是189888888888,曾经用过138123456789,还用过176987654321";
// 定义手机号码的正则表达式
String regex = "1[35768]\\d{9}"; // 1 3/5/6/7/8开头的11位手机号
//使用模式和匹配器
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(s);
// 查询Matcher类的API,可以找到find方法,上面有三个手机号,这里循环输出
while(m.find()) {
System.out.println(m.group()); //group方法是返回匹配的字符串
}
}
}
输出结果:
18988888888
13812345678
17698765432