![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
煲饭酱
数据进阶路上的煲饭酱,和他背着的用来讨饭的锅
展开
-
爬虫CASE01:反爬策略之使用随机user-agent模拟浏览器的网页爬取
知识点: 熟悉爬虫方法:使用urllib中的request方法实现网页爬取 通过设置 User-Agent 模拟浏览器,实现初级反爬策略 从user-agent池中随机选取1个user-agent的方法:random.choice(seq)的巧妙使用 … 需补充的知识点: 异常捕获和处理 … 需拓展的知识点: 采用 python3的 import requests 模块进行爬...原创 2018-07-12 20:58:22 · 1563 阅读 · 0 评论 -
正则表达式基础1:常用正则匹配,万能re,re常用语法
1、NOTES: 正则表达式学习参考链接:正则表达式30分钟入门教程 用正则匹配: URL Email 中文字符 QQ号 特殊组合: ([ \s\S]*?) : 作业: i=d%0A&from=AUTO&to=AUTO&smartresult=dict 转换成下面的形式: i:d%0A from:AUTO to:A原创 2018-07-23 10:26:24 · 5785 阅读 · 0 评论