一、前言
正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。
二、基础语法
- 字符
构造正则表达式的常用字符
字符 | 描述 |
---|---|
B | 指定字符B |
\xhh | 十六进制值为oxhh的字符 |
\uhhhh | 十六进制值为oxhhhh的Unicode字符 |
B | 指定字符B |
\t | tab |
\n | 换行 |
\r | 回车 |
\e | 转义 |
- 字符类
构造正则表达式的常用字符类
字符类 | 描述 |
---|---|
. (小数点) | 任意字符 |
[abc] | [ ] 中括号,包含a,b,c中任意字符 |
[^abc] | [ ]中括号加^, 表示否定,除a,b,c之外的 |
[a-z&&[hi]] | &&表示交集,即包含h或i |
\s | 空白字符,包含空格,换行,回车,tab,换页 |
\S | 大写为小写的取反,非空白字符,等价于[^\s] |
\d | 数字0-9 |
\D | 非数字,等价于[^0-9] |
\w | 词字符,数字,大小写字母,等价于[0-9a-zA-Z] |
\W | 非词,等价于[^\w] |
- 逻辑操作符
组合一个或多个表达式,通过逻辑操作符实现。
逻辑操作符 | 描述 |
---|---|
XY | Y跟在X后面,并且XY同时满足 |
X|Y | X或者Y |
(X) | () 小括号表示捕获组(group),可以对group进行处理,尤其是获取其中的内容 |
- 边界匹配符
构造正则表达式的常用字符
边界匹配符 | 描述 |
---|---|
^ | 一行的开始 |
$ | 一行的结束 |
\b | 词的边界 |
- 量词
量词描述了一个模式匹配文本的方式,包含:
1)贪婪型:量词默认是贪婪的,发现尽可能多的匹配
2)勉强型:通过问号(?)指定,匹配最小的字符数,也称为懒惰型,最少匹配,非贪婪。
3)占有型:通过加号(+)指定,当用于字符串时防止匹配失败时回溯。
贪婪型 | 勉强型 | 占有型 | 描述 |
---|---|---|---|
X? | X?? | X?+ | 匹配0个或1个X |
X* | X*? | X*+ | 匹配0个或多个X |
X+ | X+? | X++ | 匹配1个或多个X |
X{n} | X{n}? | X{n}+ | 恰好匹配n个X |
X{n,} | X{n,}? | X{n,}+ | 至少匹配n个X |
X{n,m} | X{n,m}? | X{n,m}+ | 至少匹配n个X,最多匹配m个X |
三、正则表达式的应用
1)分割功能
- public boolean matches(String regex)
案例1:
package program1;
import java.util.Scanner;
public class RegexDm {
public static void main(String[] args){
String age = "18-24";//定义年龄范围
String regex = "-";
String[] strArr = age.split(regex);//分割成字符串数组
int startAge = Integer.parseInt(strArr[0]);
int endAge = Integer.parseInt(strArr[1]);
Scanner sc = new Scanner(System.in);
System.out.println("请输入您的年龄:");
int a = sc.nextInt();
if (a >= startAge && a <= endAge){
System.out.println("你就是我想找的");
}else{
System.out.println("你不是我想找的");
}
}
}
2)判断功能
- public boolean matches(String regex)
案例2:
package program1;
import java.util.Scanner;
public class RegexDm {
public static void main(String[] args){
Scanner sc = new Scanner(System.in);
System.out.println("请输入手机号:");
String s = sc.nextLine();
String regex = "1[38]\\d{9}";//定义手机好规则
boolean flag = s.matches(regex);//判断功能
System.out.println("flag:"+flag);
}
}
3)替换功能
- public String replaceAll(String regex,String replacement)
案例3:
package program1;
public class RegexDm {
public static void main(String[] args){
String s = "12342jasfkgnas234";
//把字符串里面的数字替换成*
String regex = "\\d";
String ss = "*";
String result = s.replaceAll(regex,ss);
System.out.println(result);
}
}
四、总结
以上是我对正则表达式的理解和学习,正则表达式应用的范围还是比较广泛的,在Python爬虫爬取数据时候,也会用上表达式,所以花点时间去学习一下是非常必要的。可能内容上还不是十分完善,不足之处可以在评论区指出。
参考资料
1.https://blog.csdn.net/qq_18298439/article/details/88974940
2.https://blog.csdn.net/zhang5476499/article/details/53288224