前一阵子在同学的鼓动下,花了一个多月研究了股票行情的预测方法,熟悉了常见的炒股术语及技术指标,现总结如下,纯属兴趣,如果想依照本文的方法来短线操作获利,请绕道。
研究的第三步就是建立神经网络预测模型了,还是使用keras来搭建,使用简单的3层全连接层做实验,输出就是根据第二天的涨跌幅分为5类:涨(范围[0.01,])、微涨(范围[0.003,0.01])、平(范围[-0.003,0.003])、微跌(范围[-0.01,-0.003])、跌(范围[, -0.01]),测试了下这么分,5类概率几乎均等。
输入选择什么呢?如果直接将最近N天的开盘价、收盘价、交易量等原始值输进去,应该是很难训练的,毕竟不同股票的价格差异较大,同一个股票几年前的价格、交易量跟现在也类似,很难收敛,如果输入上篇文章中的股票技术指标,这些指标又太简单,主要用于绘图让人观察,我们采用了不同天数的收盘价格滑动平均(类似于MACD中的ema计算)、不同天数的收盘意愿滑动平均(类似于CR指标的计算)、不同天数的股票振幅滑动平均、不同天数的交易量滑动平均,注意所有的平均值计算完后还要除以一个基准值,使得每个值都在1.0附近。
def GetPara(m, allDate):
if 1: #简单处理下输入SVM,效果较好
data = []
tmp = avg1(m.close, 32)
data.append(m.close/tmp)
data.append(avg1(m.close, 2)/tmp)
data.append(avg1(m.close, 4)/tmp)
data.append(avg1(m.close, 8)/tmp)
data.append(avg1(m.close, 16)/tmp)
tmp = m.close.copy()
tmp[0] = (m.high[0]+m.low[0])/2
tmp[1:] = (2*m.close[:-1] + m.high[:-1] +m.low[:-1]).values /4
a = m.high - tmp
b = tmp - m.low
data.append(avg1(a, 2)/avg1(b, 2))
data.append(avg1(a, 4)/avg1(b, 2))
data.append(avg1(a, 8)/avg1(b, 2))
data.append(avg1(a, 16)/avg1(b, 2))
data.append(avg1(a, 32)/avg1(b, 2))
tmp = (m.high- m.low)/ ((m.high+ m.low+0.00001)/2)
data.append(tmp)
data.append(avg1(tmp, 2))
data.append(avg1(tmp, 4))
data.append(avg1(tmp, 8))
data.append(avg1(tmp, 16))
data.append(avg1(tmp, 32))
tmp = avg1(m.volume, 32)
data.append(m.volume/tmp)
data.append(avg1(m.volume, 2)/tmp)
data.append(avg1(m.volume, 4)/tmp)
data.append(avg1(m.volume, 8)/tmp)
data.append(avg1(m.volume, 16)/tmp)
data = np.array(data).T
X_train = []
Y_train = []
n2 = 28
for k in range(30, len(tmp)-1):
if allDate[m.date[k-1]] - allDate[m.date[k-n2]] != n2-1:
continue
X_train.append(data[k, :].ravel())
#v = (m.close[k]-m.close[k-1])/m.close[k-1]
v = (m.close[k+1]-m.close[k])/m.close[k]
if v>=0.01: tmp=0
elif v>=0.003: tmp=1
elif v>=-0.003: tmp=2
elif v>=-0.01:tmp = 3
else: tmp = 4
Y_train.append(tmp)
return X_train, Y_train
然后就是建立模型并训练,loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'], class_mode='categorical',随机采用10%的数据做验证,经过长时间的等待,结果如下:
准确率35%左右,嗯,比扔银币的20%好多了。