Selenium爬虫 -- 元素点击与定位的稳定方式

最新推荐文章于 2024-05-14 14:16:01 发布

啦啦啦___123

最新推荐文章于 2024-05-14 14:16:01 发布

阅读量1k

点赞数 1

分类专栏： Debug记录、编程小技巧 Spider-爬虫文章标签： selenium xpath html 爬虫

本文链接：https://blog.csdn.net/hhr603894090/article/details/112464256

版权

爬虫开发中免不了有定位难题和按钮点击拦截，我在本篇文章中总结问题，并给出目前我的解决方案。目录问题一：定位不稳定，时而有时而无问题二：点击按钮无效，被拦截等原因问题三：for循环的定位问题，不能顺利定位下一个大元素中的小元素问题一：定位不稳定，时而有时而无xpath的定位方式确实好用，但是定位字符串的编写也是门技术活。解决方法：绝对路径、相对路径、树形、属性寻找等，这些的示例为：# 树形文本结构寻找，绝对路径，最不稳定articles = browser1.find..

摘要由CSDN通过智能技术生成

爬虫开发中免不了有定位难题和按钮点击拦截，我在本篇文章中总结问题，并给出目前我的解决方案。

问题一：定位不稳定，时而有时而无

问题二：点击按钮无效，被拦截等原因

问题三：for循环的定位问题，不能顺利定位下一个大元素中的小元素

问题一：定位不稳定，时而有时而无

xpath的定位方式确实好用，但是定位字符串的编写也是门技术活。

解决方法：绝对路径、相对路径、树形、属性寻找等，这些的示例为：

# 树形文本结构寻找，绝对路径，最不稳定
articles = browser1.find_elements_by_xpath('/html/body/div[7]/div[3]/div/div/div/div/div/div[2]/div/div')

# 树形文本结构寻找，相对路径，较为稳定
name = article.find_element_by_xpath('./div/div[1]/span/div/span/a/span')

# 根据属性寻找（最稳定），绝对路径，找到整个页面中的第一个  # //div
articles = self.browser1.find_element_by_xpath('//div[@class="occludable-update ember-view"]')

#

最低0.47元/天解锁文章

啦啦啦___123

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Selenium爬虫 -- 元素点击与定位的稳定方式

爬虫开发中免不了有定位难题和按钮点击拦截，我在本篇文章中总结问题，并给出目前我的解决方案。目录问题一：定位不稳定，时而有时而无问题二：点击按钮无效，被拦截等原因问题三：for循环的定位问题，不能顺利定位下一个大元素中的小元素问题一：定位不稳定，时而有时而无xpath的定位方式确实好用，但是定位字符串的编写也是门技术活。解决方法：绝对路径、相对路径、树形、属性寻找等，这些的示例为：# 树形文本结构寻找，绝对路径，最不稳定articles = browser1.find..
复制链接

扫一扫