selenium浏览器中递归遍历某个节点

最新推荐文章于 2024-07-29 07:51:10 发布

tumin999

最新推荐文章于 2024-07-29 07:51:10 发布

阅读量986

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/tumin999/article/details/109333776

版权

python 专栏收录该内容

32 篇文章 0 订阅

订阅专栏

from selenium import webdriver

def recursive_traversal_child(_e):
    _children = _e.find_elements_by_xpath('./child::*')
    if len(_children) == 0:
        print(_e.tag_name, _e.id)
        if (_e.tag_name == 'p'):
            print('\t文字:', _e.text)
        elif (_e.tag_name == 'img'):
            print('\t图片:', _e.get_attribute('src'))
        else:
            print('\t暂不处理')
    else:
        for _child in _children:
            recursive_traversal_child(_child)
    pass
    
driver = webdriver.Chrome()                    
driver.get('https://xuangubao.cn/v/article/100145236')
body = driver.find_element_by_xpath('//*[@id="100145236"]/div[3]/div')
recursive_traversal_child(body)

通过自己写的一个递归访问所有叶子节点的函数来处理所有的文字和图片。