本公众号曾经推出过PyTorch实现的LSTM时间序列预测,并开源了其源码。细心的童鞋可能发现了,我之前使用的LSTM是生成式模型,而不是使用判别式进行预测。换言之,就是将序列本身作为输入,下一时刻作为输出,模型表达的是序列的联合概率分布。有兴趣的可以将其改写为判别模型。
本文将使用卷积神经网络(CNN)用于时间序列预测。区别于图像处理(二维卷积如图所示)
CNN用于序列预测时使用的是一维卷积,也就是我们熟悉的离散序列的卷积和,具体公式可以表示为:
已知序列
a={a0,a1,a2,…,am},L(a)=m+1
b={b0,b1,b2,…,bk},L(b)=k+1
用a*b表示a与b卷积后得到的一个新序列。
卷积公式
记a*b中第n个元素为(a*b)n,则
(a*b)n=a0bn + a1bn-1 +…+an-1b1 +anb0=∑akbn-k
L(a*b)=L(a)+L(b)-1
对序列做卷积,就是找到一个窗口大小为kernel_size的序列,与原序列做卷积(上述卷积公式)得到新的序列表达,一般卷积网络中还包括池化操作,就是对卷积提取的特征进行筛选得到最有用的特征,采用max-pooling方法比较多。本文使用两层卷积加两次max-pooling的卷积网络,具体模型如下:
C1表示卷积操作1
S2表示max-pooling
C3表示卷积操作2
S4表示max-pooling
最后再接一层全连接层输出
使用Pytorch构造网络模型如下:
数据沿用LSTM那篇文章:
模型定义:
模型训练测试:
模型结果:
结果图如下: