\r | 回车符(\x0D) |
\n | 换行符(\x0A),Windows中文本文件使用“\r\n”来结束一行,而Unix使用“\n” |
\t | 制表符(\x09) |
\x20 | 使用两位十六进制表示形式,可与该编号的字符匹配 |
\u002B | 使用四位十六进制表示形式,可与该编号的字符匹配 |
\Q...\E | 使用\Q 开始,\E 结束,可使中间的标点符号失去特殊意义,将中间的字符作为普通字符。 |
^ | 匹配输入字符串的开始位置 |
$ | 匹配输入字符串的结尾位置 |
() | 标记一个子表达式的开始和结束位置 |
[] | 用来自定义能够匹配“多种字符”的表达式 |
{} | 修饰匹配次数的符号 |
. | 匹配除了换行符(\n)以外的任意一个字符 |
? | 修饰匹配次数为 0 次或 1 次 |
+ | 修饰匹配次数为至少 1 次 |
* | 修饰匹配次数为 0 次或任意次 |
| | 左右两边表达式之间“或”关系 |
. | 可以匹配除了换行符(\n)以外的任意一个字符 |
\w | 可以匹配任何一个字母或者数字或者下划线 |
\s | 可以匹配空格、制表符、换页符等空白字符的其中任意一个 |
\d | 可以匹配任何一个0~9数字字符 |
\W | \W=[^\w] |
\S | \S=[^\s] |
\D | \D=[^\d] |
“贪婪模式” |
|
{n} | 表达式固定重复n次 |
{m, n} | 表达式尽可能重复n次,至少重复m次 |
{m,} | 表达式尽可能的多匹配,至少重复m次 |
? | 表达式尽可能匹配1次,也可以不匹配,相当于{0,1} |
+ | 表达式尽可能的多匹配,至少匹配1次,相当于{1,} |
* | 表达式尽可能的多匹配,最少可以不匹配,相当于{0,} |
“懒惰模式” |
|
{m,n}? | 表达式尽量只匹配m次,最多重复n次。 |
{m,}? | 表达式尽量只匹配m次,最多可以匹配任意次。 |
?? | 表达式尽量不匹配,最多匹配1次,相当于{0,1}? |
+? | 表达式尽量只匹配1次,最多可匹配任意次,相当于 {1,}? |
*? | 表达式尽量不匹配,最多可匹配任意次,相当于{0,}? |
使用竖线“|”分隔多段表达式,整个表达式可匹配其中任意一段,正则引擎是急切的,当它找到一个有效的匹配时,它会停止 搜索。因此在一定条件下,选择符两边的表达式的顺序对结果会有影响。
把正则表达式的一部分放在圆括号内,你可以将它们形成组。然后你可以对整个组使用一些正则操作,例如重复操作符。
与普通分组一样的功能,并且将匹配的子字符串捕获到一个组名称或编号名称中。