正则表达式
1.全局匹配函数使用格式
re.compile(正则表达式).findall(源字符串)
记:
普通字符 正常字符
\n 换行符
\t 制表符
\w 字母数字下划线
\W 非字母数字下划线
\d 十进制数字
\D 非十进制数字
\s 空白字符
\S 非空白字符
[ab89x] 原子表,匹配ab89x中任意一个
[^ab89x] 原子表,匹配除ab89x中任意一个
2.基础2
. 匹配除换行\n外任意一个字符
^ 匹配开始位置
$ 匹配结束位置
* 前一个字符出现0\1\多次
? 前一个字符出现0\1次
+ 前一个字符出现1\多次
{n} 前一个字符出现恰好n次
{n,} 前一个字符出现至少n次
{n,m}前一个字符出现至少n次,至多m次
| 模式选择:或
{} 模式单元,通俗来讲,想提取出什么内容,就在正则中用小括号将其括起来
3.贪婪模式 懒惰模式
贪婪模式:尽可能多地匹配
懒惰模式(用的多!):尽可能少地匹配,精准匹配
懒惰模式: *? +?
4.模式修正符
在不改变正则表达式的情况下通过模式修正符使匹配结果发生更改
re.S 让.也可以匹配多行
re.I 匹配时忽略大小写