scrapy_分布式_ERROR: Caught exception reading instance data_Unable to read instance data, giving up

最新推荐文章于 2022-05-03 09:23:29 发布

Urila

最新推荐文章于 2022-05-03 09:23:29 发布

阅读量531

点赞数

分类专栏： python问题及解决方案 scrapy 爬虫问题分布式

本文链接：https://blog.csdn.net/jss19940414/article/details/86567942

版权

python问题及解决方案同时被 3 个专栏收录

33 篇文章 1 订阅

订阅专栏

爬虫问题

27 篇文章 0 订阅

订阅专栏

scrapy

23 篇文章 0 订阅

订阅专栏

问题描述：

将已经写好的scrapy分布式项目部署到linux环境中后执行spider.py文件报错，如下

2019-01-20 23:05:08 [boto] ERROR: Caught exception reading instance data
Traceback (most recent call last):
  File "/usr/lib/python2.7/dist-packages/boto/utils.py", line 210, in retry_url
    r = opener.open(req, timeout=timeout)
  File "/usr/lib/python2.7/urllib2.py", line 429, in open
    response = self._open(req, data)
  File "/usr/lib/python2.7/urllib2.py", line 447, in _open
    '_open', req)
  File "/usr/lib/python2.7/urllib2.py", line 407, in _call_chain
    result = func(*args)
  File "/usr/lib/python2.7/urllib2.py", line 1228, in http_open
    return self.do_open(httplib.HTTPConnection, req)
  File "/usr/lib/python2.7/urllib2.py", line 1198, in do_open
    raise URLError(err)
URLError: <urlopen error timed out>
2019-01-20 23:05:08 [boto] ERROR: Unable to read instance data, giving up

解决办法：

网络上给出的解决办法是在项目的settings.py文件中，加上

DOWNLOAD_HANDLERS = {'S3': None,}
但是我按照这个方法添加完运行错误还在，最后在spider.py文件中加入
from scrapy import optional_features
optional_features.remove('boto')

再次运行spider.py文件。成功

原文：https://blog.csdn.net/u014408532/article/details/72961118

Urila

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy_分布式_ERROR: Caught exception reading instance data_Unable to read instance data, giving up

问题描述：将已经写好的scrapy分布式项目部署到linux环境中后执行spider.py文件报错，如下2019-01-20 23:05:08 [boto] ERROR: Caught exception reading instance dataTraceback (most recent call last): File "/usr/lib/python2.7/dist-pac...
复制链接

扫一扫

专栏目录