![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
tracefiow
这个作者很懒,什么都没留下…
展开
-
python爬虫中Response [503]问题
503 (Service Unavailable/服务无法获得)最近我在爬取某漫画网址是,在爬取100多话后就会出现503在循环爬取也是503应该是ip被封禁了 过一段时间就可以了可以代理ip状态码503 (SC_SERVICE_UNAVAILABLE)表示服务器由于在维护或已经超载而无法响应。例如,如果某些线程或数据库连接池已经没有空闲则servlet会返回这个头信息。服务器可提供一个Re...原创 2020-05-04 18:14:51 · 10272 阅读 · 2 评论 -
selenium爬取知乎文章内容和图片
代码主要实现功能使用selenium+chrome自动登录知乎,查找问题,并把所有的文章(作者,赞同数,内容,图片)都保存在数据库中(mongodb)from selenium import webdriverimport time,reimport requestsfrom bs4 import BeautifulSoupimport pymongofrom selenium.web...原创 2020-04-16 23:28:43 · 714 阅读 · 1 评论