python xpath text_虽然已经使用/text(),但无法使用Xpath获取文本

您的XPath表达式与任何内容都不匹配,因为您尝试擦除的HTML页面严重损坏。FF(或任何其他web浏览器)会在移动中修复页面,然后再显示它。这将导致添加HTML标记,而这些标记在原始文档中不存在。在

下面的代码包含一个XPath表达式,它很可能会为您指明正确的方向。在import requests

from lxml import html, etree

sample_page = requests.get("https://www.racenet.com.au/horse-racing-results/happy-valley/2016-11-16")

tree = html.fromstring(sample_page.content)

nodes = tree.xpath("//*[@id='resultsListContainer']/div/table[@class='tblLatestHorseResults']/tr[@class='raceDetails']/td/span[1]")

for node in nodes:

print etree.tostring(node)

执行时,将打印以下内容:

^{pr2}$

小贴士:每当你试图抓取一个网页,但事情没有如预期的那样工作,下载HTML并保存到一个文件中。在这种情况下,例如:

^{3}$

然后看看保存的HTML。这将使您了解DOM的外观。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值