xpath补充：lxml.etree常用方法，使用selenium、xpath定位不到标签时处理办法

最新推荐文章于 2023-05-24 10:18:03 发布

旧人小表弟

最新推荐文章于 2023-05-24 10:18:03 发布

阅读量2.1k

点赞数 2

分类专栏：网络爬虫文章标签：定位 css xpath python vue

本文链接：https://blog.csdn.net/weixin_43040873/article/details/109126558

版权

这些东西几年前学selenium和appium的时候就经常遇到，而且还不止这些，当时各种坑都踩过，为此还去学了一段时间自动化测试，刚好正准备整理selenium笔记的时候有个网友用selenium-xpath时遇到了这些问题来找我，稍微去百度了一下，然后又看了以前写过的代码，发现自己真的又又失忆了，都是以前玩过的 o(╥﹏╥)o
随便整理了几个方法，其实还有很多(o(╥﹏╥)o)

在这篇文章之后，又将selenium的基本使用已经整理了，但是还有很多细节(坑)，得慢慢想起来了再补充

.get_attribute()

.get_attribute是selenium中的方法

获取HTML文档（源码）、文本内容

在使用selenium定位元素时，虽然同样可以通过xpath定位，但是提取文档时，却并不能直接使用xpath中的text()或者string()方法来获取文档，所以需要先通过xpath定位到标签，然后再通过etree来提取

# 1、获取标签内的源码，包含所获标签  innerHTML
temp = driver.find_element_by_xpath("//div/h1")
html= temp.get_attribute('innerHTML')

driver.find_element_by_class_name('column').get_attribute('innerHTML')
# 获取到的是整个column标签下面所有的html，是字符串格式，不对etree对象有用


# 2、获取标签内的源码，不包含所获标签  outerHTML
temp = driver.find_element_by_xpath("//div/h1")
html= temp.get_attribute('outerHTML')


# 3、获取标签中的文本内容  textContent
texts = driver.find_elements_by_xpath('//div/a')  # 文本所在的标签

for i in texts:
　　name = i.get_attribute('textContent')
　　print(name)

示例1

startTime = browser.find_element_by_xpath

最低0.47元/天解锁文章

旧人小表弟

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
xpath补充：lxml.etree常用方法，使用selenium、xpath定位不到标签时处理办法

获取属性的值和标签中的文本有时候不能直接定位到标签的属性，需要首先定位到webelement，之后get到属性try: temp['host_url'] = node.find_element_by_xpath('./div/div/div/ytd-video-meta-block/div/div/div/yt-formatted-string/a/@href') temp['host_url'] = node.find_element_by_xpath('./div/div/div/ytd
复制链接

扫一扫

专栏目录