1.在pyspider框架运行的时候出现
HTTP 599: SSL certificate problem: unable to get local issuer certificate错误
(1)如图:
(2)原因:
这个错误会发生在请求 https 开头的网址,SSL 验证错误,证书有误。
(3)解决办法:
使用 self.crawl(url, callback=self.index_page, validate_cert=False)
这个方法基本可以解决问题了。
如果还有问题,请参考文章 PySpider HTTP 599: SSL certificate problem错误的解决方法 后面的解决方法。
如图:
2.pyspider运行报错:HTTP 599: Could not resolve host599: Could not resolve host
问题是:
哥们你断网了。
3.爬虫翻页设置:
next = response.doc(".pagnation.nav.next").attr.href
self.crawl(next,callback=self.index_page,validate_cert=False)
(附:这应该是最后一篇有关Pyspider的内容了,现在主流基本上用的是Scrapy,接下来应该是这个方面的学习啦~
继续fighting!~)