首先需要import re
python自带正则表达式是一组c语言二进制码接口,因此速度较快。
正则表达式里面有一些特殊字符——matacharacters,包括
. ^ $ * + ? { } [ ] \ | ( )
[ ] 用来指明一类数据,[a-c],[abc],都是用来匹配a,b,c中任何一个字母
[ ] 中的元字符失去了其魔力,而变成了一个普通的字符
\ 让 元字符失去魔力的另一个方法,但也给一些普通字符与魔力
\d
[0-9]
.
\D
[^0-9]
.
\s
[ \t\n\r\f\v]
.
\S
[^ \t\n\r\f\v]
.
\w
[a-zA-Z0-9_]
.
\W
[^a-zA-Z0-9_]
.
. 用于匹配除newline以外的任何东西
需要匹配newline的时候,试用re.dotall