python使用selenium webdriver从隐藏元素中获取文本

python使用selenium webdriver从隐藏元素中获取文本

由于webdriver spec的定义,Selenium WebDriver 只会与可见元素交互,所以获取隐藏元素的文本总是会返回空字符串。 
可是,在某些情况下,我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName'), 通过textContentinnerTextinnerHTML等属性获取。

  • innerHTML 会返回元素的内部 HTML, 包含所有的HTML标签。 
    例如,<div>Hello <p>World!</p></div>innerHTML会得到Hello <p>World!</p>
  • textContent 和 innerText 只会得到文本内容,而不会包含 HTML 标签。 
    • textContent 是 W3C 兼容的文字内容属性,但是 IE 不支持
    • innerText 不是 W3C DOM 的指定内容,FireFox不支持

 示例


 
 
  1. from selenium import webdriver
  2. DEMO_PAGE = '''data:text/html,
  3. <p>Demo page for how to get text from hidden elements using Selenium WebDriver.</p>
  4. <div id='demo-div'>Demo div <p style='display:none'>with a hidden paragraph inside.</p><hr /><br /></div>'''
  5. driver = webdriver.PhantomJS()
  6. driver.get(DEMO_PAGE)
  7. demo_div = driver.find_element_by_id( "demo-div")
  8. print demo_div.get_attribute( 'innerHTML')
  9. print driver.execute_script( "return arguments[0].innerHTML", demo_div)
  10. print demo_div.get_attribute( 'textContent')
  11. print driver.execute_script( "return arguments[0].textContent", demo_div)
  12. driver.quit

输出


 
 
  1. Demo div <p style= "display:none"> with a hidden paragraph inside.</p><hr><br>
  2. Demo div <p style= "display:none"> with a hidden paragraph inside.</p><hr><br>
  3. Demo div with a hidden paragraph inside.
  4. Demo div with a hidden paragraph inside.

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值