在做python scrapy爬虫爬艺搜网站的项目时,遇到了以下问题。
File "E:\课程学习文件\大三下册\信息检索\2019.4.45.TW04\yisou1\yisou1\spiders\spider.py", line 61, in new_parse
yield scrapy.Request(url, meta={'item2': item2}, callback=self.addr_parse)
File "c:\users\ly\appdata\local\programs\python\python36\lib\site-packages\scrapy\http\request\__init__.py", line 25, in __init__
self._set_url(url)
File "c:\users\ly\appdata\local\programs\python\python36\lib\site-packages\scrapy\http\request\__init__.py", line 62, in _set_url
raise ValueError('Missing scheme in request url: %s' % self._url)
ValueError: Missing scheme in request url: /institution-ORG31847.html
原因:以下的url_ok没有使用绝对url
yield scrapy.Request(url_ok, meta={'item2': item2}, callback=self.addr_parse)
解决办法:构造绝对url。