关于爬取百度指数中的整体日均值（复现他人思路以及过程心得）

kuailebisai

于 2024-02-11 11:30:59 发布

阅读量1.5k

点赞数 23

文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_49277059/article/details/136094960

版权

本文介绍了如何使用Python爬取百度指数数据，通过读取Excel中的股票名称列表，为每个股票抓取2012年至2022年的指数数据，并将结果存储在Excel文件中。作者提醒了使用代理以避免IP被封禁的问题，并提到了数据解码和使用selenium等其他爬取方法的可行性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

序言：

首先感谢两篇文章的作者【项目小结】爬虫学习进阶：获取百度指数历史数据_%ool-CSDN博客

Python爬虫|百度指数爬虫项目（简易版）_百度指数爬虫 python 代码-CSDN博客

附上代码：

import json
import os
import pandas as pd
import requests
from openpyxl import Workbook
import time
#读取想要了解数据的股票名称
qiye_name=[]
df = pd.read_excel('企业选择.xlsx', sheet_name='读取列')
shape = df.shape
# print(shape)
name_column = df['股票名称']
for i in range(shape[0]):
    my_string=name_column[i].strip()
    qiye_name.append(my_string)

# 创建一个新的 Excel 工作簿
wb = Workbook()
# 获取默认的工作表
ws = wb.active
# 循环写入数据
for row in range(2, shape[0]+2):
    ws.cell(row=row, column=1, value=qiye_name[row-2