正则表达式
本质来说就是一个字符串,我们可以在这个字符串指定一些规则,然后拿着这份规则对其他数据做校验
使用格式
String telRegex = “编写规则” ;
“需要做校验的字符串” .matches(telRegex));
规则种类
字符类
[abc] 只能是a,b,或c
[ ^ abc] 除了a, b, c之外的任何字符
[a-zA-Z] a到z A到Z, 包括(范围)
[a-d[m-p]] a到d或m通过p: ([a-dm-p]联合)
[a-z&&[def]] d, e,或f(交集)
[a-z&&[ ^bc]] a到z, 除了b和C: ([ad-z]减法)
[a-z&&[ ^m-p]] a到z, 除了m到p: ([a-1q-z]减法)[ ]是对单个字符做限制
预定义字符类
. 表示任何字符
\d 表示一个数字: [0-9]
\D 表示非数字: [ ^0-9]
\s 表示一个空白字符: [ \t\n\x0B\f\r]
\S 表示非空白字符: [ ^\s]
\w 表示[a-ZA-Z_0-9] 英文、数字、下划线
\W [ ^\w] 表示一个非单词字符
:转义字符
String regex="\\d"; //需先用第一个\对第二个做转义,使第二个\不会对d做转义
数量(出现次数)
X? X, 一次或0次
X* X,零次或多次(任意次数)
X+ X,一次或多次
X {n} X,正好n次
X {n, } X,至少n次
X {n,m} X,至少n但不超过m次
X代表任意字符类规则
练习
手机号正则
必须是1开头
第二位:3456789
全都是数字,必须是11位
String telRegex = "[1][3-9]\\d{9}";
QQ号正则
不能以0开头
全部都是数字
5~12位
String qqRegex ="[1-9]\\d{4,11}";
邮箱正则
zhangSan@itcast . cn
zhangsanQ163. com
123456@qq. com
zhangsan@sina . com
zhangsanQitcast. qq.com
zhangsanQXXx. edu
zhangsan@xxx.org
String emailRegex = "\\W+ // 至少一次个数英文、数字、下划线
[@][\w&&[^_]]+ //@ 至少一次个数 英文、数字
(\\.[a-z]{2,3})+"; //正则组:一个. 两到三个字
将此正则组执行至少一次
String类中与正则有关的方法
public String replaceAll(String regex,String newStr)
//按照正则表 达式匹配的内容进行替换
public String[] split(String regex)
//按照正则表达式匹配的内容进行分割字符串,反回一一个字符串数组
用Pattern类方法爬取字符串
String regex = "[1][3-9]\d{9}1\w+[Q][\w&&[^_]]+(\\. [a-z]{2,3})+I[0]\\d{2,}-?\d{7,}400-?\d{}-?\d{4}";
// 1.将正则表达式封装为Pattern 对象
Pattern pattern = Pattern.compile(regex);
// 2.用Pattern调用matcher()方法获取匹配器对象,并传给Matcher类对象matcher
Matcher matcher = pattern.matcher(data);
//3.将以上代码优化
while (matcher.find()) { //find每次向下查找一个符合正则的字符串,查找成功返回ture
System.out.printLn(matcher.group()); //每次返回一个符合要求的字符串
}