1.定义:匹配某些规则的字符串。
2.String的matches方法:public boolean matches(Stringregex);
例如:
public static boolean checkPhone(String phoneNumber){
return phoneNumber.matches("13[0-9]{9}");//查询输入字符串是否为电话格式
}
3.String的split方法: public String[ ] split (String regex ) :根据给定的正则表达式,拆分字符
例如:
String a = "qw wqe qw qweqw qwe";
String[] arrs = a.split(" +");
for (String string : arrs) {
System.out.println(string);
}
String replaceStringBefore = "aaa1131dw4124112121dlakdjl1111232";
String replaceStringAfter = replaceStringBefore.replaceAll("\\d+", "*");
System.out.println(replaceStringAfter);
5.Pattern和Matcher的应用
Pattern p = Pattern.compile("南海是中国的!*");//将正则表达式编译成对象
Matcher m = p.matcher("南海是中国的!!!");//通过模式对象得到匹配对象,传入要匹配的字符串
boolean b = m.matches();//验证是否匹配
System.out.println(b);
6.Pattern和Matcher的应用延伸
<span style="white-space:pre"> </span>Pattern p = Pattern.compile("[0-9]{1,5}");
Matcher m = p.matcher("das23131kdjwljdal34231hdakhdwdal23132sjdwale41211jqwoe44444ohalkdnasldw");
while(m.find()){
System.out.println(m.group());
}
查找5位数字,通过Matcher的find()方法判定是否存在5位数字,通过Matcher的group()方法返回第一个取到的5位数字
构造 | 匹配 |
---|---|
字符 | |
x | 字符 x |
\\ | 反斜线字符 |
\0n | 带有八进制值 0 的字符 n (0 <= n <= 7) |
\0nn | 带有八进制值 0 的字符 nn (0 <= n <= 7) |
\0mnn | 带有八进制值 0 的字符 mnn(0 <= m <= 3、0 <= n <= 7) |
\xhh | 带有十六进制值 0x 的字符 hh |
\uhhhh | 带有十六进制值 0x 的字符 hhhh |
\t | 制表符 ('\u0009') |
\n | 新行(换行)符 ('\u000A') |
\r | 回车符 ('\u000D') |
\f | 换页符 ('\u000C') |
\a | 报警 (bell) 符 ('\u0007') |
\e | 转义符 ('\u001B') |
\cx | 对应于 x 的控制符 |
字符类 | |
[abc] | a、b 或 c(简单类) |
[^abc] | 任何字符,除了 a、b 或 c(否定) |
[a-zA-Z] | a 到 z 或 A 到 Z,两头的字母包括在内(范围) |
[a-d[m-p]] | a 到 d 或 m 到 p:[a-dm-p](并集) |
[a-z&&[def]] | d、e 或 f(交集) |
[a-z&&[^bc]] | a 到 z,除了 b 和 c:[ad-z](减去) |
[a-z&&[^m-p]] | a 到 z,而非 m 到 p:[a-lq-z](减去) |
预定义字符类 | |
. | 任何字符(与行结束符可能匹配也可能不匹配) |
\d | 数字:[0-9] |
\D | 非数字: [^0-9] |
\s | 空白字符:[ \t\n\x0B\f\r] |
\S | 非空白字符:[^\s] |
\w | 单词字符:[a-zA-Z_0-9] |
\W | 非单词字符:[^\w] |
POSIX 字符类(仅 US-ASCII) | |
\p{Lower} | 小写字母字符:[a-z] |
\p{Upper} | 大写字母字符:[A-Z] |
\p{ASCII} | 所有 ASCII:[\x00-\x7F] |
\p{Alpha} | 字母字符:[\p{Lower}\p{Upper}] |
\p{Digit} | 十进制数字:[0-9] |
\p{Alnum} | 字母数字字符:[\p{Alpha}\p{Digit}] |
\p{Punct} | 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ |