书名: 《精通Python网络爬虫》
作者:韦玮
索引:ISBN978-7-111-56208-5
出版社:机械工业出版社
出版时间:2017年3月
第二篇 第5章 正则表达式与Cookie
所谓正则表达式,相当于搜索条件,比如搜索书名,或电子邮件
其中,p56, 元字符,即正则表达式中具有特殊含义的字符,
. 匹配出换行符外的任意字符
* 匹配0次、1次或多次前面的原子
例子是:
import re
pattern=”py.*n”
string=”abcdddfphp345pythony_py”
result=re.search(pattern,string)
print(result)
输出结果为<_sre.SRE_Match object; span=(13,19),match=’python’>
如果pattern改为”py*n”,输出结果应为None。因为系统将搜索”pyy”+任意字符或字符串+”n”