使用scrapy爬数据时候 IndexError: list index out of range

最新推荐文章于 2024-06-29 11:25:42 发布

四如君

最新推荐文章于 2024-06-29 11:25:42 发布

阅读量884

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_44699828/article/details/108217366

版权

在使用Scrapy进行数据爬取时，遇到`IndexError: list index out of range`错误，通常是由于尝试访问空列表导致的。解决方法是将`list[0].extract()`替换为`extract_first()`，后者在列表为空时不抛出异常，而是返回None。但此改动可能使数据库字段出现NULL值，引发如`(1048, “Column ‘unit_type’ cannot be null”)`的错误。为解决这个问题，需要调整数据库设计，允许该字段接受NULL值或提供默认值。" 111970041,10542804,Eureka快速剔除失效服务,"['微服务', 'Eureka', '服务治理', '服务注册与发现', 'Spring Cloud']

摘要由CSDN通过智能技术生成

错误原因：xpath解析数据成列表list，取列表list[0]时列表其实是空的，list index out of range
错误代码如下：

content_list = response.xpath('//html/body/div[1]/div[4]/div[4]/div[2]/div/div')
        for cont in content_list:
            re_name = cont.xpath('./div/div[2]/div[1]/span/a/text()')[0].

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

四如君

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用scrapy爬数据时候 IndexError: list index out of range

错误原因：xpath解析数据成列表list，取列表list[0]时列表其实是空的，list index out of range错误代码如下：content_list = response.xpath('//html/body/div[1]/div[4]/div[4]/div[2]/div/div') for cont in content_list: re_name = cont.xpath('./div/div[2]/div[1]/span/a/text()
复制链接

扫一扫