常用正则表达式
- 单字符:
. :除换行外所有字符
[] : [aoe]、[a-w]匹配集合中任意一个字符
\d : 数字[0-9]
\D : 非数字
\w : 数字、字母、下划线、中文
\W : 非\w
\s : 所有的空白字符,包括空格、制表符、换页符等等,等价于[\f\n\r\t\v]
\S : 非空白 - 数量修饰:
* : 任意多次
+ : 至少一次
? : 可有可无,0/1次
{m} : 固定m次
{m,} : 至少m次
{m,n} : m-n次 - 边界:
$ : 以某某结尾
^ : 以某某开头
分组:
(ab) - 贪婪模式: .*
非贪婪模式: .*?
re.I :忽略大小写
re.M :多行匹配
re.S : 单行匹配 - 方法:
re.sub(正则表达式,替换内容,字符串)
match: 只从开头开始找
search: 从任意位置开始找
findall: 找所有