scrapy爬http返回503 Service Unavailablec错误

最新推荐文章于 2024-07-01 10:34:24 发布

qinfei0967

最新推荐文章于 2024-07-01 10:34:24 发布

阅读量1.5w

点赞数 4

分类专栏： python爬虫 scrapy 文章标签： scrapy user-agent 反爬虫

本文链接：https://blog.csdn.net/qinfei0967/article/details/80959645

版权

问题：scrapy shell 请求页面时返回503 Service Unavailablec错误

2018-07-08 15:30:23 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET http://www.xicidaili.com/nn/2>
 (failed 3 times): 503 Service Unavailable
2018-07-08 15:30:23 [scrapy.core.engine] DEBUG: Crawled (503) <GET http://www.xicidaili.com/nn/2> (referer: None)
2018-07-08 15:30:24 [traitlets] DEBUG: Using default logger
2018-07-08 15:30:24 [traitlets] DEBUG: Using default logger
[s] Available Scrapy objects:
[s]   scrapy     scrapy module (contains scrapy.Request, scrapy.Selector, etc)
[s]   crawler    <scrapy.crawler.Crawler object at 0x000000F7A1053C18>
[s]   item       {}
[s]   request    <GET http://www.xicidaili.com/nn/2>
[s]   response   <503 http://www.xicidaili.com/nn/2>
[s]   settings   <scrapy.settings.Settings object at 0x000000F7A10539E8>
[s]   spider     <DefaultSpider 'default' at 0xf7a12d7518>

补充：常见可能被网站识别返回错误

1、CAPTCHApages （captcha，验证码）

2、Unusualcontent delivery delay （响应时间、速度变慢了）

3、Frequentresponse with HTTP404,301 or 50x errors

（1）301 MovedTemporarily

（2）401unauthorized

（3）403forbidden （aAatch处理的）

最低0.47元/天解锁文章

qinfei0967

关注

4
点赞
踩
13

收藏

觉得还不错? 一键收藏
3
评论
scrapy爬http返回503 Service Unavailablec错误

问题：scrapy shell 请求页面时返回503 Service Unavailablec错误2018-07-08 15:30:23 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying &lt;GET http://www.xicidaili.com/nn/2&gt; (failed 3 times): 503 Servi...
复制链接

扫一扫

专栏目录