基于循环神经网络预测股价
一、数据获取
1.1 训练过程中所有的股票日K数据均来自tushare
import tushare
pro = ts.pro_api(token)
df = pro.daily(ts_code, start_date, end_date)
df.to_csv(filename)
二、 数据预处理
2.1 获取到的数据格式如图所示
2.2 特征选取
我选取了股票交易数据中几个有用的特征
特征
说明
open
开盘价
high
最高价
low
最低价
close
收盘价
pre_close
昨日收盘价
chagne
涨跌额
pct_chg
涨跌幅
vol
成交量(手)
amount
成交额(千元)
2.3 数据标准化或归一化
去除特征量纲,加速模型收敛,这里采用标准化处理。
2.4 生成时间序列
这里选取30天为一个时间序列,来预估低31天的开盘价、收盘价、最高价和最低价
def series_data(df, n):
"""
将数据组装成时间序列
:param df: DataFrame对像
:param n: 时间序列长