用selenium爬虫获取百度指数数据，轻松实现！

最新推荐文章于 2024-03-23 10:51:22 发布

码农世界环卫工

最新推荐文章于 2024-03-23 10:51:22 发布

阅读量1.4k

点赞数

文章标签：指数浏览器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oGuJing123/article/details/130776746

版权

在互联网时代，数据分析和挖掘已经成为了企业和个人必不可少的能力，而百度指数数据是一个非常重要的数据来源。但是如何获取这些数据呢？本文将介绍如何使用selenium爬虫技术，轻松获取百度指数数据。

一、selenium简介

selenium是一个自动化测试工具，可以模拟用户操作浏览器，实现自动化任务。通过selenium我们可以在浏览器中打开网页、输入搜索关键字、点击按钮等等一系列操作，从而实现自动化采集数据。

二、安装selenium

要使用selenium，首先需要安装selenium库。在cmd命令行中输入以下命令即可：

pip install selenium

三、安装浏览器驱动

由于selenium是通过模拟浏览器操作来实现自动化任务的，所以我们需要下载对应的浏览器驱动。这里以chrome为例，进入官网下载对应版本的chromedriver.exe，并将其放置在环境变量PATH下。

四、编写代码

接下来就可以编写代码开始爬取百度指数数据了。具体步骤如下：

1.导入所需库

from selenium import webdriver

import time

2.打开浏览器并访问百度指数页面

driver = webdriver.Chrome()

driver.get('')

3.登录百度账号

#点击登录按钮

driver.find_element_by_css_selector('#auto_gif_wrap > div.login-wrap >a').click()

#输入账号密码并点击登录

driver.find_element_by_css_selector('#TANGRAM__PSP_10__footerULoginBtn').click()

driver.switch_to.frame('TANGRAM__PSP_10__iframe')

driver.find_element_by_name('userName').send_keys('your_username')

driver.find_element_by_name('password').send_keys('your_password')

driver.find_element_by_id('TANGRAM__PSP_10__submit').click()

#等待登录成功

while True:

time.sleep(1)

if driver.current_url !='':

break

4.输入搜索关键字并点击搜索

#输入搜索关键字

driver.find_element_by_css_selector('#schword').send_keys('Python')

#点击搜索

driver.find_element_by_css_selector('#searchWords >a.button.button-go').click()

5.获取百度指数数据

#等待页面加载完毕

time.sleep(5)

#获取指数数据

data =[]

for i in range(30):

date = driver.find_elements_by_css_selector('#trend rect')[i].get_attribute('data-date')

index = driver.find_elements_by_css_selector('#trend rect')[i].get_attribute('data-index')

data.append((date, index))

6.数据处理与保存

#将数据保存到csv文件中

import csv

with open('data.csv','w', encoding='utf-8-sig', newline='') as f:

writer = csv.writer(f)

writer.writerow(['日期','指数'])

for item in data:

writer.writerow([item[0], item[1]])

7.关闭浏览器

driver.quit()

五、总结

通过selenium爬虫技术，我们可以轻松获取百度指数数据。当然，这只是一个简单的示例，实际应用中还需要根据具体情况进行改进和优化。

码农世界环卫工

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
用selenium爬虫获取百度指数数据，轻松实现！

在互联网时代，数据分析和挖掘已经成为了企业和个人必不可少的能力，而百度指数数据是一个非常重要的数据来源。但是如何获取这些数据呢？本文将介绍如何使用selenium爬虫技术，轻松获取百度指数数据。一、selenium简介selenium是一个自动化测试工具，可以模拟用户操作浏览器，实现自动化任务。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。