python爬虫
煲饭酱
数据进阶路上的煲饭酱,和他背着的用来讨饭的锅
展开
-
爬虫CASE01:反爬策略之使用随机user-agent模拟浏览器的网页爬取
知识点:熟悉爬虫方法:使用urllib中的request方法实现网页爬取通过设置 User-Agent 模拟浏览器,实现初级反爬策略 从user-agent池中随机选取1个user-agent的方法:random.choice(seq)的巧妙使用…需补充的知识点:异常捕获和处理…需拓展的知识点:采用 python3的 import requests 模块进行爬...原创 2018-07-12 20:58:22 · 1599 阅读 · 0 评论 -
正则表达式基础1:常用正则匹配,万能re,re常用语法
1、NOTES: 正则表达式学习参考链接:正则表达式30分钟入门教程用正则匹配:URLEmail中文字符QQ号特殊组合: ([ \s\S]*?) : 作业: i=d%0A&from=AUTO&to=AUTO&smartresult=dict转换成下面的形式:i:d%0Afrom:AUTOto:A原创 2018-07-23 10:26:24 · 5848 阅读 · 0 评论