抓取的URL存下来的时候可能为字符串,scrapy提取的时候只提取到第一个字母 h 。
解决方案:
image_url = post_node.css('dt.img a img::attr(onerror)').extract_first('') # 获取图片
front_image_url = [image_url if 'http:' in image_url else ('http:' + image_url)] # 判断图片是否为链接
抓取的URL存下来的时候可能为字符串,scrapy提取的时候只提取到第一个字母 h 。
解决方案:
image_url = post_node.css('dt.img a img::attr(onerror)').extract_first('') # 获取图片
front_image_url = [image_url if 'http:' in image_url else ('http:' + image_url)] # 判断图片是否为链接