![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 67
qq_40314386
这个作者很懒,什么都没留下…
展开
-
python爬虫是怎么处理验证码的
如果直接从生成验证码的页面把验证码下载到本地后识别,再构造表单数据发送的话,会有一个验证码同步的问题,即请求了两次验证码,而识别出来的验证码并不是实际需要发送的验证码。有如下几种方法解决。法1:用session:mysession = requests.Session()login_url = 'http://xxx.com'checkcode_url='http://yyy.com'...翻译 2018-07-23 23:33:36 · 243 阅读 · 1 评论 -
Python数据采集-开始爬虫
目标捉取网页外链,递归循环实现。一 遍历单个域名网页爬虫,就是对目标网页进行捉取,然后遍历到数据信息,然后有链接的继续遍历,如此回调。第一步:将页面的所有链接获取运行效果图发现会存在些没用用的数据,有些href的值只是作为页面块的跳转,我们可以使用正则表达式进行优化过滤掉,只获取带有HTML结尾的链接第二步:递归获取网页第一步我们基本把一个网页的所有链接地址...原创 2018-07-23 23:36:45 · 501 阅读 · 0 评论 -
用Python 写一个机器人陪你聊天(文尾有彩蛋)
工作一忙,原来秉烛夜谈的好友现在都很少聊天,微信都成了微信群的天下,鲜有微信好友给你发消息,想要主动发却也找不到开题话题,怎么办?用Python写一个机器人陪自己聊聊天吧。以下是源码及解析,小白都看得懂。一定要看完,结尾还有惊喜彩蛋~一、工具简介1——Python。写代码的工具;2——itchat库。第三方库,用来登录微信,接收并回复微信好友信息;3——图灵机器人。第三方接口,我们...原创 2018-07-21 22:53:29 · 394 阅读 · 0 评论