一,指定匹配字符:
范围字符:[ ]
[xyz] | 匹配指定字符中的任意一个字符 | 添加^表示排除指定字符 |
[a-z] | 匹配指定范围中的任意一个字符 | |
x|y | 匹配指定字符x或y中的任意一个 | |
[\u4e00-\u9fa5] | 匹配任意汉字 |
任意字符:., \w, \d, \s
. | 匹配任意字符,除“\r\n” | |
\w | 匹配任意字母,数字,下划线 | |
\d | 匹配任意数字 | |
\s | 匹配任意空白,如空格、制表符、换页符等 | \n:换行符 \r:回车符 \t:制表符 \f:换页符 \v:垂直制表符 |
大写取反。
二,指定匹配次数:*, +, ?, {n}
* | 零次或多次 | |
+ | 一次或多次 | |
? | 零次或一次 | |
{n} | n次 | |
{n,} | 最少n次 | |
{n,m} | 最少n次,最多m次 |
贪婪与非贪婪:?
设置匹配次数后,默认是贪婪匹配,就是尽可能匹配到最多的字符。在量词后添加?后,改为非贪婪模式。
源字符串:<div>aaa</div><div>bbb</div>
正则表达式1:<div>.*</div> 匹配结果:<div>aaa</div><div>bbb</div>
正则表达式2:<div>.*?</div> 匹配结果:<div>aaa</div>
三,指定匹配位置:\b, ^, $
\b | 匹配任何单词的边界 | |
^ | 匹配字符串的开始位置 | |
$ | 匹配字符串的结束位置 |
四,指定匹配前提条件:(?=), (?!), (?<=), (?<!)
用来指定匹配前必须满足的前提条件。
注意:前提条件中的正则表达式exp,只是用来声明某种特征,不会用于真正的匹配。
(?=exp) | 尾部符合exp | 如\b\w+(?=ing\b), 查找I'm singing while you're dancing.时,它会匹配sing和danc |
(?!exp) | 尾部不符合exp | 如\d{3}(?!\d),匹配三位数字,而且这三位数字的后面不能是数字 |
(?<=exp) | 头部符合exp | 如(?<=\bre)\w+\b,查找reading a book时,它匹配ading |
(?<!exp) | 头部不符合exp | 如(?<![a-z])\d{7},匹配前面不是小写字母的七位数字 |
五,用匹配得到的字符作为接下来的匹配条件:()
(exp) | 匹配得到的字符保存到\1,\2...\9 | (a|b)\1 相当于aa|bb。在匹配“abaa”时,匹配到的结果是“aa” | |
(?<name>exp) | 匹配得到的字符保存到\<name> |