python：tushare 获取A股指数数据，并使用LSTM预测

最新推荐文章于 2024-05-13 22:07:40 发布

belldeep

最新推荐文章于 2024-05-13 22:07:40 发布

阅读量1.8k

点赞数 3

分类专栏： python 文章标签： python tushare keras

本文链接：https://blog.csdn.net/belldeep/article/details/109272450

版权

python 专栏收录该内容

203 篇文章 22 订阅

订阅专栏

根据tushare官网资料（http://tushare.org/）目前仅支持下面A股指数查询。
指数名称   TS指数代码
上证指数   sh
深圳成指   sz
沪深300指数   hs300
上证50   sz50
中小板   zxb
创业板   cyb

get_zs.py

# coding: utf-8
import pandas as pd
import tushare as ts

df = ts.get_k_data('sh', start='2016-01-01')
df.to_csv('shzs.csv')
df = ts.get_k_data('sz', start='2016-01-01')
df.to_csv('szzs.csv')
df = ts.get_k_data('hs300', start='2016-01-01')
df.to_csv('hs300.csv')
df = ts.get_k_data('sz50', start='2016-01-01')
df.to_csv('sz50.csv')
df = ts.get_k_data('zxb', start='2016-01-01')
df.to_csv('zxb.csv')
df = ts.get_k_data('cyb', start='2016-01-01')
df.to_csv('cyb.csv')

运行 python get_zs.py

https://www.lfd.uci.edu/~gohlke/pythonlibs/

在该网址下找到 tensorflow‑1.9.0‑cp37‑cp37m‑win_amd64.whl

pip install tensorflow-1.9.0-cp37-cp37m-win_amd64.whl

python 3.7 只能用 tf 1.9 也就是说: py 3.7+ tf 1.9 + keras 2.2.0
pip install keras==2.2.0

以下参考: https://blog.csdn.net/lpp5406813053/article/details/89788108

keras_lstm_1.py

# encoding=utf-8

#数据预处理以及绘制图形需要的模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#构建长短时神经网络需要的方法
from sklearn.preprocessing import MinMaxScaler
from keras.models import Sequential
from keras.layers import Dense, LSTM, BatchNormalization
 
#需要之前60次的数据来预测下一次的数据
need_num = 60
#训练数据的大小
training_num = 500
#迭代10次
epoch = 10
batch_size = 32
 
#训练数据的处理，我们选取整个数据集的前500个数据作为训练数据，后面的数据为测试数据
#从csv读取指数 数据
zs = 'hs300'
dataset = pd.read_csv(zs+'.csv')
#我们需要预测收盘价
data = dataset.iloc[:, 3:4].values
print(zs,':',data.shape)
#训练数据就是上面已经读取数据的前500行
training_data = data[:training_num]
#因为数据跨度几年，随着时间增长，数字也随之增长，因此需要对数据进行归一化处理
#将所有数据归一化为0-1的范围
sc = MinMaxScaler(feature_range=(0, 1))
'''
fit_transform()对部分数据先拟合fit，
找到该part的整体指标，如均值、方差、最大值最小值等等（根据具体转换的目的），
然后对该trainData进行转换transform，从而实现数据的标准化、归一化等等。
'''
training_data_scaled = sc.fit_transform(X=training_data)
 
x_train = []
y_train = []
#每60个数据为一组，作为测试数据，下一个数据为标签
for i in range(need_num, training_data_scaled.shape[0]):
    x_train.append(training_data_scaled[i-need_num: i])
    y_train.append(training_data_scaled[i, 0])
#将数据转化为数组
x_train, y_train = np.array(x_train), np.array(y_train)
#因为LSTM要求输入的数据格式为三维的，[training_number, time_steps, 1]，因此对数据进行相应转化
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))
 
#构建网络，使用的是序贯模型
model = Sequential()
#return_sequences=True返回的是全部输出，LSTM做第一层时，需要指定输入shape
model.add(LSTM(units=128, return_sequences=True, input_shape=[x_train.shape[1], 1]))
model.add(BatchNormalization())
 
model.add(LSTM(units=128))
model.add(BatchNormalization())
 
model.add(Dense(units=1))
#进行配置
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(x=x_train, y=y_train, epochs=epoch, batch_size=batch_size)
 
#进行测试数据的处理
#前500个为测试数据，但是将500-60个数据作为输入数据，因为这样可以获取
#测试数据的潜在规律
inputs = data[training_num - need_num:]
 
inputs = inputs.reshape(-1, 1)
#这里使用的是transform而不是fit_transform，因为我们已经在训练数据找到了
#数据的内在规律，因此，仅使用transform来进行转化即可
inputs = sc.transform(X=inputs)
x_validation = []
 
for i in range(need_num, inputs.shape[0]):
    x_validation.append(inputs[i - need_num:i, 0])
 
x_validation = np.array(x_validation)
x_validation = np.reshape(x_validation, (x_validation.shape[0], x_validation.shape[1], 1))
 
#这是真实的股票价格，是源数据的[500:]即剩下的数据的价格
real_stock_price = data[training_num:]
#进行预测
predictes_stock_price = model.predict(x=x_validation)
#使用 sc.inverse_transform()将归一化的数据转换回原始的数据，以便我们在图上进行查看
predictes_stock_price = sc.inverse_transform(X=predictes_stock_price)

#绘制数据图表，红色是真实数据，蓝色是预测数据
plt.plot(real_stock_price, color='red', label=zs+' Stock Price')
plt.plot(predictes_stock_price, color='blue', label='Predicted Stock Price')
plt.title(zs+' Stock Price Prediction')
plt.xlabel('date')
plt.ylabel('Stock Price')
plt.legend()
plt.grid()
plt.show()

belldeep

关注

3
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
python：tushare 获取A股指数数据，并使用LSTM预测

根据tushare官网资料（http://tushare.org/）目前仅支持下面A股指数查询。指数名称 TS指数代码上证指数 sh深圳成指 sz沪深300指数 hs300上证50 sz50中小板 zxb创业板 cybget_zs.py# coding: utf-8import pandas as pdimport tushare as tsdh = ts.get_hist_data('sh', start='2018-01-01')...
复制链接

扫一扫