正则表达式测试网址:在线正则表达式测试
一、元字符:具有固定含义的特殊符号
常用元字符:
. | 匹配除换行符以外的任意字符 | |||
\w | 匹配字母或数字或下划线 | \W | 匹配非 字母或数字货下划线 (大写W) | |
\s | 匹配任意的空白符 | \S | 匹配非空白符(大写S) | |
\d | 匹配数字 | \D | 匹配非数字(大写D) | |
\t | 匹配一个制表符 | ^ | 匹配字符串的开始 | |
\n | 匹配一个换行符 | $ | 匹配字符串的结尾 | |
a|b | 匹配字符a或字符b | () | 匹配括号内的表达式,也表示一个组 | |
[...] | 匹配字符组中的字符 | [^...] | 匹配除了字符组中字符的所有字符 |
量词:控制前面的元字符出现的次数:
* | 重复零次或更多次 | {n} | 重复n次 | |
+ | 重复一次或更多次 | {n,} | 重复n次或更多次 | |
? | 重复零次或一次 | {n,m} | 重复n到m次 |
贪婪匹配和惰性匹配:
.* | 贪婪匹配 | .*? | 惰性匹配 (写爬虫的时候用的多) |