【1701H1】【穆晨】【180130】第112天总结
爬虫,我们需要踩点,用find方法寻找ip等其他需要的元素,太麻烦,而且网站一改可能代码就失效了
这时候用正则表达式就方便多 了
python中的通配符是‘.’他可以匹配除换行符之外的任何字符
若想匹配到‘.’怎么办
接下来进入正题,若想要匹配ip地址怎么办
不可行。。。。确实,\d匹配的是0到9的数字,\d\d\d匹配的是000到999的数字,
但ip是0到255还不一定有三位,而且不美观
下面我们先来看看字符类
注意:
1.有严格的大小写之分
2.找到符合要求即停止,默认匹配成功
3.‘-’表示搜索范围
{}来表示重复多少次,{,}重复多少次的范围
[]里面表示的是字符,[0-255],[0-25]表示的都是在0,1,2,5里面匹配
为什么不行呢,发现不是一定要是三位数,不一定要是001,所以我们把前两位弄成可有可无
但这还不是最佳的表达式
今天就学到这