rst=re.search(表达式,数据)
\w 匹配任何字母数字下划线
\d 匹配任意一个十进制数
\s 匹配任意一个空白字符
\W 匹配任何除了字母数字下划线的字符
. 匹配除换行符外任意字符
^ 匹配待搜索字符串的开始位置
$ 匹配待搜索字符串的结束位置
* 匹配n次前面原子,例如"s*"匹配可匹配sssss,也可匹配sssssssss
? 匹配0次或者一次 即s和ss
+ 匹配一次或者多次前面的原子
{n}匹配前面的原子恰好出现n次
{n,}匹配前面的原子至少出现n次
{n,m}匹配前面的原子至少出现n次,至多出现了m次
| 匹配模式选择符,或者的意思
模式修正符:
S 匹配时也能匹配到换行符
I 匹配时不区分大小写,例:rst=re.search(表达式,数据,re.I)
.* 贪婪匹配,匹配尽量多
.*?懒惰匹配,匹配尽量少
全局搜索函数:rst2=re.compile(表达式).findall(数据) 返回形式为列表
匹配网站wangzhan="[a-zA-Z]+://[^\s]*[.com|cn]"