摘要:BigQuant人工智能量化投资平台上的StockRanker算法在选股方面有不俗的表现,模型在15、16年的回测收益率也很高(使用默认因子收益率就达到170%左右)。然而,StockRanker在股灾时期回撤很大(使用默认因子回撤55%),因此需要择时模型,控制StockRanker在大盘走势不好时的仓位。 LSTM(长短期记忆神经网络)是一种善于处理和预测时间序列相关数据的RNN。本文初步探究了LSTM在股票市场的应用,进而将LSTM对沪深300未来五日收益率的预测作为择时器并与StockRanker结合使用,在对回测收益率有较好保证的前提下,较为显著地降低了StockRanker的回撤。
LSTM Networks(长短期记忆神经网络)简介
LSTM Networks是递归神经网络(RNNs)的一种,该算法由Sepp Hochreiter和Jurgen Schmidhuber在Neural Computation上首次公布。后经过人们的不断改进,LSTM的内部结构逐渐变得完善起来(图1)。在处理和预测时间序列相关的数据时会比一般的RNNs表现的更好。目前,LSTM Networks已经被广泛应用在机器人控制、文本识别及预测、语音识别、蛋白质同源检测等领域。基于LSTM Networks在这些方面的优异表现,本文旨在探究LSTM是否可以应用于股票时间序列的预测。
LSTM Networks处理股票时间序列的流程
本文使用的LSTM处理股票序列的流程如图2。本文的整体流程均在BigQuant量化投资平台上进行,构建LSTM模型使用库主要为Keras。
数据获取与处理:对于时间序列,我们通常会以[X(t-n),X(t-n+1),…,X(t-1),X(t)]这n个时刻的数据作为输入来预测(t+1)时刻的输出。对于股票来说,在t时刻会有若干个features,因此,为了丰富features以使模型更加精确,本文将n(time series)×s(features per time series)的二维向量作为输入。LSTM对于数据标准化