正则表达式:正确规则的表达式
正则表达式是一门独立的语法,在其他语言中同样适用
作用:用来校验数据是否符合定义的正则表达式的规则
比较复杂的正则表达式网上一般都会有,我们需要了解一些简单的及其规则
规则字符在java.util.regex Pattern类中 JDK.API中直接搜Pattern
java中正则表达式用字符串来定义
一些简单的规则
-
```java
A.字符
x 表示字符x
\反斜线字符
\n 换行符
\r 回车符String regx = “a”;
boolean b = “abc”.matches(regx);//false
boolean b1 = “a”.matches(regx);//true
//“abc”.matches(regx) 用来判断字符串是否符合传入的正则表达式regx = “[a,b,c]”;//只要被判断的数据是中括号中的一个就行
regx = “[0-9]”;//是0到9的整数中的一个就行
regx = “[^0-9]”;//不是0到9的整数就行 ^取反
regx = “[A-Z]”;//判断是不是大写字母中的一个
regx = “[A-Za-z0-9]”;//判断是不是大小写字母和0-9的整数B.预定义字符
regx = “.”;//. 通配字符,通配单个任意字符
regx = “\.”;//用\转义后指代表 . 本身
regx = “…”;//匹配两个任意字符
regx = “|”;// | 代表或者 |匹配会显示错误C.简写
regx = “\d”;//等同于[0-9]
regx = “\w”;//等同于[0-9A-Z_a-z] 0-9 A-Z _ a-z
永远匹配单个D.量词
? 一次或一次也没有 如空串 就是没有 至多一次
* 零次或多次 大于等于1 都算多次 不能是一次
+ 一次或多次 至少一次
{n} 恰好n次
{n,} 至少n次
{n,m} 至少n次,不超过m次
split()方法 正则表达式的分割功能
String str = "username=张三";
截取"username"和"张三"
String[] sp = str.split("=");
System.out.println(sp[0]);//"username"
System.out.println(sp[1]);//"张三"
replaceAll与正则相关的替换功能
"奥巴马和克林顿是美国总统".replace("奥巴马","*").replace("克林顿","*");
String str = "56a4s1d6565a4fas41f5a465f4as65f4a35sf415as64f6asf4as5f24as635f4";
清除str中的数字
String str1 = str.replaceAll([0-9]+,"");//根据正则表达式,将所有数字替换成空串
Pattern和Matcher
pattern类 模式器
在regex包下
正则表达式的编译表示形式
用来封装正则表达式
Matcher类 匹配器
Matcher 可以封装一个待匹配的数据
可以通过匹配器中的方法进行匹配
通常使用格式为:
Pattern p = Pattern.compile(正则表达式);
Matcher m = p.matcher(待匹配的数据);
boolean b = m.matches();
如果说你只是想看一个字符串是否符合一个正则表达式,那么就可以使用字符串类中的matches()方法
而在模式器和匹配器中还有其他方法来满足更加复杂的需求
String str = "da jia ting wo shuo,jin tian xia yu,bu shang wan zi xi,ni men gao xing bu?";
获取str中有三个子母组成的字符串
boolean find(); 查找与该模式匹配的输入序列的下一个子序列
String group(); 返回友谊签匹配操作所匹配的输入子序列
写出三个字母的正则
String regex = "[a-z]{3}";
再把正则表达式封装(传入)到模式器p中
Pattern p = Pattern.compile(regex);
然后用模式器p获取匹配器m,并将待匹配的字符串封装(传入)到匹配器m中
Matcher m = p.matcher(str);
之后再在带匹配的字符串中使用find方法寻找符合正则表达式的字符串
boolean b = m.find();
如果寻找到了,就使用group方法截取
if(b){
String g = m.group();
System.out.println(g);//"jin"
}
之后继续
boolean b = m.find();
if(b){
String g = m.group();
System.out.println(g);//"tin"
}
结果不是预料中的"jin"而是"tin",问题处在正则表达式上
需要加上边界匹配器String regex = "\\b[a-z]{3}\\b";表示是一个完整的单词
我们可以用这两种方法的组合来截取自己需要的网站、邮箱等