selenium获取html元素中的文本内容

Jane-8

已于 2022-03-23 00:10:28 修改

阅读量7.9k

点赞数 1

分类专栏： python 文章标签： python

于 2022-03-22 22:26:59 首次发布

本文链接：https://blog.csdn.net/qq_45765158/article/details/123673038

版权

python 专栏收录该内容

2 篇文章

订阅专栏

方法1：`.text`

直接定位元素

直接使用xpath路径定位元素，最后使用.text获取元素中文本

注意！！： 此时text_translation取.text 之前类型为WebElement

from selenium import webdriver

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

text_translation = driver.find_element_by_xpath('//span[@class="VIiyi"]/span/span').text

方法2：`text()`

使用etree.HTML (提前导入模块from lxml import etree)

etree.HTML先解析当前页面资源，再路径定位元素时，路径最后添加/text()获取文本，取文本列表中第一个元素[0]

注意！！： 此时text_translation取[0] 之前类型为list，list输出为[‘hello’]

from selenium import webdriver
from lxml import etree

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

source = etree.HTML(driver.page_source)
text_translation = source.xpath('//span[@class="VIiyi"]/span/span/text()')[0]