限定符
符号 | 实际意义 |
---|---|
a* | a出现0次或多次 |
a+ | a出现1次或多次 |
a? | a出现0次或1次 |
a{6} | a出现6次 |
a{2,6} | a出现2-6次 |
a{2,} | a出现两次以上 |
或运算符
符号 | 实际意义 |
---|---|
(a|b) | 匹配a或者b |
(ab)|(cd) | 匹配ab或者cd |
字符类
符号 | 实际意义 |
---|---|
[abc] | 匹配a或者b或者c |
[a-c] | 匹配a或者b或者c |
[a-zA-F0-9] | 匹配大小写英文字符以及数字 |
[^0-9] | 匹配日非数字字符 |
^
非的意思,匹配响应的补集。
元字符
符号 | 实际意义 |
---|---|
\d | 匹配数字字符 |
\D | 匹配非数字字符 |
\w | 匹配单词字符(英文、数字、下划线) |
\W | 匹配非单词字符 |
\s | 匹配空白符(包含换行符、Tab) |
\S | 匹配非空白字符 |
. | 匹配任意字符 |
\b | 标注字符的边界(全字匹配) |
^ | 匹配行首 |
$ | 匹配行尾 |
小写字母表示匹配XX字符,大写字母表示匹配非XX字符
^
和上面的非进行区分写在
[]
中在限定字符前代表 非 在正则表达式中参与的是行首。
贪婪/懒惰匹配
符号 | 实际意义 |
---|---|
<.+> | 默认贪婪匹配“任意字符” |
<.+?> | 懒惰匹配“任意字符” |