Scrapy框架中利用xpath解析网页时出现的几种错误

1.网页源代码与用‘’inspect in firepath ”看到的网页标签不一样,造成拿到的数据为空或者报“IndexError: list index out of range”的错误

    (1)inspect in firepath看到的源代码

         

     ( 2)网页源码

   

   (1)和(2)经过对比可以看出:(2)中<a>标签少了,只有</a>,response.xpath('

//div[@id="pic_con"]/div/img[@id="imgis"]/@src
')这样写才正确,不能加上<a>标签。因为ID是唯一的,所以此问题只需response.xpath('//img[@id="imgis"]')即可。

   总结:当利用xpath取数据为空或者出错时,先检查xpath写的是否正确,如果xpath写的没问题,那就再看源代码是否与

firepath一样。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值