JAVA正则表达式匹配符
Java中正则表达式与之前使用的Python是有区别的,区别在于Java对于反斜线()处理的不同。
在Python中"\d"表示 匹配一位数字(0-9),而Java中匹配一位数字(0-9),需要的正则表达式为"\d"。
不过换行符和制表符只需要单反斜线“\n\t”。
字符
字符 | 描述 |
---|---|
B | 指定字符B |
\xhh | 十六进制值为oxhh的字符 |
\uhhhh | 十六进制值为oxhhhh的Unicode字符 |
\t | tab |
\n | 换行 |
\r | 回车 |
\e | 转义 |
字符类
字符类 | 描述 |
---|---|
. (小数点) | 任意字符 |
[abc] | [ ] 中括号,包含a,b,c中任意字符 |
[^abc] | [ ]中括号加^, 表示否定,除a,b,c之外的 |
[a-z] | 从a到z的任意字符 |
[a-z&&[hi]] | &&表示交集,即包含h或i |
\s | 空白字符,包含空格,换行,回车,tab,换页 |
\S | 大写为小写的取反,非空白字符,等价于[^\s] |
\d | 数字0-9 |
\D | 非数字,等价于[^0-9] |
\w | 词字符,数字,大小写字母,等价于[0-9a-zA-Z] |
\W | 非词,等价于[^\w] |
逻辑操作符
逻辑操作符 | 描述 |
---|---|
XY | Y跟在X后面,并且XY同时满足 |
X | Y |
(X) | () 小括号表示捕获组(group),可以对group进行处理,尤其是获取其中的内容 |
边界匹配符
边界匹配符 | 描述 |
---|---|
^ | 一行的开始 |
$ | 一行的结束 |
\b | 词的边界 |
量词
量词描述了一个模式匹配文本的方式,包含
贪婪型:量词默认是贪婪的,发现尽可能多的匹配
勉强型:通过问号(?)指定,匹配最小的字符数,也称为懒惰型,最少匹配,非贪婪。
占有型:通过加号(+)指定,当用于字符串时防止匹配失败时回溯。
贪婪型 勉强型 占有型 描述
X? X?? X?+ 匹配0个或1个X
X* X*? X*+ 匹配0个或多个X
X+ X+? X++ 匹配1个或多个X
X{n} X{n}? X{n}+ 恰好匹配n个X
X{n,} X{n,}? X{n,}+ 至少匹配n个X
X{n,m} X{n,m}? X{n,m}+ 至少匹配n个X,最多匹配m个X