正则表达式,主要起到判断作用,将复杂的代码段替换为简单的语句,用来描述或者匹配一系列符合某个语句规则的字符串,如下例,判断用户的QQ号是否为12或19开头:
package zyh;
import java.util.Scanner;
public class zz {
public static void main(String[] args){
Scanner sc = new Scanner(System.in);
System.out.println("请输入QQ号:");
String s = sc.nextLine();
String regex = "1[29]\\d{8}";//定义QQ号的规则或者说是形式
boolean flag = s.matches(regex);//判断QQ号的开头
System.out.println("flag:"+flag);
}
}
很明显,使用正则表达式可以省略一大串关于字符串读取、判断、分割、替换的代码段,给开发者带来了极大的工作效益和准确性,下面介绍部分常用正则表达式符号:
字符 | 说明 |
$ | 匹配输入字符串结尾的位置,如果设置了 RegExp 对象的 Multiline 属性,$ 还会与"\n"或"\r"之前的位置匹配 |
* | 零次或多次匹配前面的字符或子表达式,例如,zo* 匹配"z"和"zoo"。* 等效于 {0,} |
+ | 一次或多次匹配前面的字符或子表达式,例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹配。+ 等效于 {1,} |
? | 零次或一次匹配前面的字符或子表达式,例如,"do(es)?“匹配"do"或"does"中的"do”,? 等效于 {0,1} |
^ | 匹配输入字符串开始的位置,如果设置了 RegExp 对象的 Multiline 属性,^ 还会与"\n"或"\r"之后的位置匹配 |
{n} | n 是非负整数,正好匹配 n 次,例如,"o{2}"与"Bob"中的"o"不匹配,但与"food"中的两个"o"匹配 |
{n,} | n 是非负整数,至少匹配 n 次,例如,"o{2,}“不匹配"Bob"中的"o”,而匹配"foooood"中的所有 o。"o{1,}“等效于"o+”。"o{0,}“等效于"o*” |
{n,m} | m 和 n 是非负整数,其中 n <= m,匹配至少 n 次,至多 m 次,例如,"o{1,3}"匹配"fooooood"中的头三个 o。‘o{0,1}’ 等效于 ‘o?’。注意:您不能将空格插入逗号和数字之间 |
[xyz] | 字符集,匹配包含的任一字符。例如,"[abc]“匹配"plain"中的"a” |
[^xyz] | 反向字符集,匹配未包含的任何字符,例如,"[^abc]“匹配"plain"中"p”,“l”,“i”,“n” |
x | y |
[x-z] | 字符范围,匹配指定范围内的任何字符,例如,"[x-z]"匹配"x"到"z"范围内的任何小写字母 |
\d | 数字字符匹配,等效于 [0-9] |
\D | 非数字字符匹配,等效于 [ ^0-9] |
\w | 匹配任何字类字符,包括下划线。与"[A-Za-z0-9_]"等效 |
\W | 与任何非单词字符匹配。与"[ ^A-Za-z0-9_]"等效 |
正则表达式是一种可以用于模式匹配和替换的强有力的工具,一个正则表达式就是由普通的字符(例如字符 x 到 z)以及特殊字符(称为元字符)组成的文字模式,它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
总而言之,如果不能准确快速地使用正则表达式,那么实现程序的时间会很长,并且非常容易出现错误,相反,如果能掌握使用正则表达式,那么繁琐的代码可以变得简单轻松,达到事半功倍的奇效。