正则表达式
正则表达式概述
使用单个字符串来描述/匹配一系列符合某个语法规则的字符串,正则表达式不属于Java的技术,是大部分语言都支持的技术,类似于json
正则表达式的语法
正则表达式由两种基本字符组成
原义字符:字符本身就是一个正则表达式,例如a,b,c,\t,\n,\r,\f等等
元字符:* + ? ¥ …… () [] {}等等【有特殊含义的字符】
对正则表达式进行分类
字符类:[abc]将字符进行归类,可以出现[]中的其中一个 对abc其中一个进行匹配
[^abc]对不是abc的字符进行匹配
范围类:[a-z] 表示a-z中的一个字符
预定义类:
\d == [0-9] 数字 digit
\D == [^0-9] 非数字
空白字符:[\t\n\x0B\f\r] == \s
[^\t\n\x0B\f\r] == \S 非空白字符
[a-zA-Z0-9] \w word
[^a-zA-Z0-9] \W
.任何字符(与行结束符可能匹配也可能不匹配)
边界字符
^:以xxx开头
$:以xxx结尾
\b:单词边界
\B:非单词边界