xpath中双斜杆的用处

// 从匹配选择的当前节点选择文档中的节点,不考虑它们的位置

上面的说明有点绕,我们拆开来理解:匹配选择的当前节点就是xpath的双斜杠之前的规则所匹配得到的节点,此时以这个节点作为根节点来找其他节点;不考虑它们的位置指的是,即使当前节点下的内容存在嵌套关系,也直接忽略,由前到后进行匹配。

看一个例子:

# 我们想要从下列HTML文档中匹配出气温的范围,如何实现?
# <div class='temp'>
# 	<span>20</span>
#	~
#	<span>22</span>
# </div>

# 错误的写法一
# 该写法将得到一个list而非文本串
temperature = resp.xpath('//div[@class="temp"]/text()').extract()

# 错误的写法二
# 该写法将得到波浪号 '~'
temperature = resp.xpath('//div[@class="temp"]/text()').extract()[0]

# 正确的写法
# 该写法将得到 '20~22'
temperature = ''
for temp in resp.xpath('//div[@class="temp"]//text()').extract():
	temperature += temp

# 上面的写法先使用//定位到当前的div节点,然后按照从前到后的顺序依次匹配文本,组成一个list
# 使用循环遍历list,组装完整的字符串
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值