正则表达式,英文Regular expressions,也叫REs、regexs或regex patterns。
1. 匹配字符
-
.
:匹配除换行符外任意一个字符 -
[...]
:匹配‘[]’中任意一个字符 -
[^...]
:匹配除‘[]’中的字符外的任意一个字符 -
\d
:匹配任何十进制数字 -
\D
:匹配任何非数字字符 -
\s
:匹配任何空白字符 -
\S
:匹配任何非空白字符 -
\w
:匹配字母、数字及下划线 -
\W
:匹配不是字母、数字及下划线的字符
2. 重复
-
...*
:匹配‘*’之前的字符零次或更多次 -
...+
:匹配‘+’之前的字符一次或更多次 -
...?
:匹配‘?’之前的字符零次或一次,非贪婪方式 -
...{n}
:匹配‘{n}’之前的字符n次 -
...{m,n}
:匹配‘{m,n}’之前的字符m~n次,贪婪方式
3. 行的开头和结尾
-
^...
:匹配行的开头 -
...$
:匹配行的末尾
4. 断言
-
\b
:零宽度断言,匹配英文单词的开头或结尾。例,\bclass\b
将匹配‘完整的单词class’ -
\B
:零宽度断言,匹配英文单词的中间或边缘部分。例,\Bclass\B
将匹配‘declassified’
5. 其他
-
(...)
:匹配括号内的表达式 -
...|...
:相当于“or”运算符,优先级很低