最开始使用使用网上的方法引入tushare库,但是运行到最后一直报错。所以到最后不想DEBUG了,直接使用我们爬下来的数据,自己写了这个,玩美运行!!!
1引入库
import os #主要用path 子模块,遍历文件夹
import pandas as pd #数据分析常用库
from pandas import DataFrame #用于处理表格型的数据结构
2获取文件夹内csv数据
path = '2021年股票数据/'
files = os.listdir(path)
train_csv = list(filter(lambda x:(x[-4:] == '.csv'),files))
#选择文件夹内.csv结尾的文件,并存入列表
data_list = []
for fileitem in train_csv:
tmp = pd.read_csv(path + fileitem,header=None)
#使用pandas读取刚才列表中的csv文件
all_data[fileitem] = tmp #存入字典
3利用pandas库处理股票数据
all_data = {}
price = DataFrame({tic: data[1] for tic, data in all_data.items()})
# 计算股票价格每日变化
returns = price.pct_change()
# 计算相关性
corr = returns.corr()
corr.to_csv("res.csv")#将结果输出为csv文件