使用extract()进行xpath解析的几种情况

最近在做爬虫的细节整理,想要弄清楚一些原来没有注意的问题,特此总结!
在进行对HTML解析时我们可能会遇到如下五种情况:

这里写图片描述

  • 返回一个SelectorList 对象
SelectorList 类是内建 list 类的子类,提供了一些额外的方法:
xpath(query)
css(query)
extract()
re()
__nonzero__()
  • 返回一个list(就是系统自带的那个) 里面是一些你提取的内容
  • 返回2中list的第一个元素(如果list为空抛出异常)
  • 返回1中SelectorList里的第一个元素(如果list为空抛出异常),和3达成的效果一致
  • 返回的是一个str, 所以5会返回str的第一个字符
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值