python selenium判断网页是否包含关键字_Python和Selenium-获取不包括子节点文本的文本...

在Python3中使用web scraping时,如果遇到包含子节点的元素,如何只提取直接文本而不包括子节点的内容?原始HTML结构为'VIVEGRPNHen,la.'解决方案是通过删除子节点文本,从所有文本中提取直接父节点的文本。
摘要由CSDN通过智能技术生成

Using Python 3.

Supposing:

text

other

If I do:

elem = driver.find_element_by_xpath("//whatever")

elem.text contains "text other"

If I do:

elem = driver.find_element_by_xpath("//whatever/text()[normalize-space()]")

elem is not Webelement.

How my I proceed to grab only "text" (and not "other")?

Id est: grab only text in direct node, not the child nodes.

UPDATE:

Original HTML is:

VIVEGRPN

Hen, la.

解决方案

You can remove the child node text from the all text

all_text = driver.find_element_by_xpath("//whatever").text

child_text = driver.find_element_by_xpath("//subchild").text

parent_text = all_text.replace(child_text, '')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值