一 、 正则表达式
常用元字符
. 匹配除换行符之外的任意字符
\w 匹配字母、数字、下划线
\s 匹配任意的空白符号
\d 匹配数字
\n 匹配换行符
\t 匹配一个制表符
^ 匹配字符串的开始
$ 匹配字符串的结束
\\b 结尾边界处的指定字符串 ban\\b aaaban
\\B 开头边界处的指定字符串 ban\\B banaaa
大写 相当于取非
\W 匹配非字母、数字或下划线
\D 匹配非数字
\S 匹配非空白字符
a|b 匹配字符a或b
() 匹配括号内的表达式,也表示一个组
[...] 匹配字符组中的字符
[^...] 匹配除了字符组中字符的所有字符
量词
控制元字符出现的次数
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复多少次
{n,} 重复n到更多次
{n,m} 重复n到m次
贪婪匹配与惰性匹配
.* 贪婪匹配
.*? 惰性匹配