关于selenium脚本运行获取空值并退出解决办法

最新推荐文章于 2023-01-10 17:58:06 发布

大数据采集及分析RPA

最新推荐文章于 2023-01-10 17:58:06 发布

阅读量651

点赞数 1

分类专栏：爬虫数据采集网络爬虫文章标签： selenium python 爬虫

本文链接：https://blog.csdn.net/qq_27109535/article/details/125097511

版权

数据采集同时被 3 个专栏收录

78 篇文章 0 订阅

订阅专栏

爬虫

68 篇文章 2 订阅

订阅专栏

网络爬虫

63 篇文章 2 订阅

订阅专栏

关于selenium中text返回空值的原因
这几天闲来无事，在做爬虫的过程中遇到了一个小问题，获取值的xpath正确，可以正常获取到标签属性。但是获取文本的时候却获取到了空值。
错误代码如下：

    with open('核酸数据.csv', 'w', encoding='utf-8',newline='') as csvfile:  # 新建并打开comment_con.csv文件
        writer = csv.writer(csvfile)
        writer.writerow(['机构名字', '所在县区','联系电话','机构地址'])  # 写第一行

        for n in range(2536):  # 进行99次循环
            m = n + 1
            print(m)

            #拉到底部
            driver.execute_script(
                'window.scrollTo(0,document.body.scrollHeight)'
            )

            #第三到第六个li标签li[position()>2][position()<5]
            #//input[contains(@name,’na’)] 查找name属性中包含na关键字的页面元素

            user = driver.find_elements_by_xpath("/html/body/div[2]/div[2]/div[4]/div[1]/div/p[1]")  # 获取用户名
            lis01 = driver.find_elements_by_xpath("/html/body/div[2]/div[2]/div[4]/div[1]/div/p[2]/span[2]")  # 获取评论
            lis02 = driver.find_elements_by_xpath("/html/body/div[2]/div[2]/div[4]/div[1]/div/p[3]/span[2]/span[1]")  # 获取评论
            lis03 = driver.find_elements_by_xpath("/html/body/div[2]/div[2]/div[4]/div[1]/div/p[4]/span[2]")  # 获取评论
            for i in range(len(user)):
                writer.writerow([user[i].text, lis01[i].text, lis02[i].text , lis03[i].text])
                print([user[i].text, lis01[i].text, lis02[i].text , lis03[i].text])

            button2 = driver.find_element_by_xpath('//*[@id="nextPage"]').click()  # 获取下一页按钮

            sleep(random.uniform(0.6, 0.8))  # 生成一个a到b的小数等待时间
            print("第%d页完成" % m)