selenium 爬取中国经济社会发展数据库数据 (2)优化爬取速度和解决StaleElementReferenceException

最新推荐文章于 2023-10-25 11:24:16 发布

Cmmm丶

最新推荐文章于 2023-10-25 11:24:16 发布

阅读量588

点赞数 3

分类专栏： web scraping

本文链接：https://blog.csdn.net/weixin_46090057/article/details/106606025

版权

点赞发Nature
关注中Science

上一版本的爬取测试代码在这
第一版爬取代码

对上一版本进行了一些测试，主要问题有两个

用time.sleep()作为固定等待时长导致了爬取速度过慢，同时，也有可能存在网速问题等客观因素导致的抛错
在进行大量数据爬取时，会抛出StaleElementReferenceException错误

对代码进行了一些优化

def find_table(indicator, region, year):
    wait = WebDriverWait(
        browser,
        40,
        ignored_exceptions=(NoSuchElementException, StaleElementReferenceException),
    )
    browser.find_element_by_name("IndicateName").clear()
    browser.find_element_by_name("IndicateName").send_keys(indicator)
    browser.find_element_by_name("IndicateRegion").clear()
    browser.find_element_by_name("IndicateRegion").send_keys(region)
    browser.find_element_by_name("EndYear").send_keys(year)
    element = browse

最低0.47元/天解锁文章

Cmmm丶

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
selenium 爬取中国经济社会发展数据库数据 (2)优化爬取速度和解决StaleElementReferenceException

求点赞！！！求点赞！！！求点赞！！！上一版本的爬取测试代码在这添加链接描述对上一版本进行了一些测试，主要问题有两个用time.sleep()作为固定等待时长导致了爬取速度过慢，同时，也有可能存在网速问题等客观因素导致的抛错在进行大量数据爬取时，会抛出StaleElementReferenceException错误对代码进行了一些优化def find_table(indicator, region, year): wait = WebDriverWait(
复制链接

扫一扫