python lxml xpath_python - lxml中xpath获取本节点及以下所有节点的text()方法?

问 题

商品名称:养生堂天然维生素E软胶囊

商品编号:720135

品牌: 养生堂

以上是网页源码,现通过xpath匹配所有Li

import lxml.etree as etree

html = html.decode("utf-8")

tree = etree.HTML(html)

property_list_reg = "//ul[@id='parameter2']/li/text()"

property_lst = tree.xpath(property_list_reg)

print len(property_lst)

输出结果:

3

商品名称:养生堂天然维生素E软胶囊

商品编号:720135

品牌:

如果换成:

property_list_reg = "//ul[@id='parameter2']/li//text()" #此处//

输出结果:

4

商品名称:养生堂天然维生素E软胶囊

商品编号:720135

品牌:

养生堂

显然,这不是我想要的结果,我想要的结果是这样

3

商品名称:养生堂天然维生素E软胶囊

商品编号:720135

品牌: 养生堂

求大神指导~ 该如何实现?

解决方案

正确的做法时使用Xpath的 string 函数

import lxml.etree as etree

html = """

商品名称:养生堂天然维生素E软胶囊

商品编号:720135

品牌: 养生堂

"""

tree = etree.HTML(html)

property_list_reg = '//ul[@id="parameter2"]//li'

property_lst = tree.xpath(property_list_reg)

for e in property_lst:

print(e.xpath('string(.)'))

print(len(property_lst))

wx.jpg

扫一扫关注IT屋

微信公众号搜索 “ IT屋 ” ,选择关注与百万开发者在一起

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值