本文主要描述Java正则表达式(Regular Expression),其作用是预先定义一个规则,然后,使用该规则匹配输入的字符串是否符合定义的规则,也可以从匹配的输出中提取字符串,正则表达式的常用使用场景包括字符串校验、提取字符串、规则引擎、语法规则。
正则定义
字符
x 字符x \\ 反斜杆 \xhh 十六进制值0xhh \t tab键('\u0009') \n 换行符('\u000A') \r 回车键('\u000D') |
列举 [abc] 字符a、b、c [^abc] 不包括a、b、c的字符 [a-zA-Z] 范围a到z、范围A到Z的字符 [a-d[m-p]] 范围a到d、范围m到p的并集 [a-z&&[def]] 范围a到z与字符d、e、f的交集 [a-z&&[^bc]] 范围a到z不包括字符b、c [a-z&&[^m-p]] 范围a到z不包括字符范围m到p |
通用 . 点号表示任意字符 \d 数字0到9,[0-9] \D 非数字0到9,[^0-9] \s 空格符 \S 非空格符,[^\s] \w 字, [a-zA-Z_0-9] \W 非字, [^\w] |
界限 ^ 行开始位置 $ 行结束位置 |
次数 X? X, 出现0次、一次 X* X, 出现0次、多次 X+ X, 出现一次、多次 X{n} X, 出现n次 X{n,} X,出现大于或等于n次 X{n,m} X, 出现大于或等于n次并且小于或等于m次 |
逻辑 XY XY并排 X|Y X或者Y (X) X, 分组 |
使用示例
(([[a-zA-Z]+-?[a-zA-Z0-9]+]+)@([[a-zA-Z0-9]+\\.[a-zA-Z0-9]+]+)) 定义一个分组的正则表达式,其形式是((a)@(b)),使用正则匹配可以提取其中分组a、b对应的字符串 |