深度学习前沿 | 利用GAN预测股价走势

本文介绍了利用生成对抗网络(GAN)结合LSTM和CNN预测股票价格的思路与方法。通过特征工程、模型建立(LSTM作为生成器,CNN作为判别器)、参数优化(包括贝叶斯优化和深度强化学习DRL)实现股价预测。实验在高盛股票上取得良好效果,计划简化后在平台上实现。
摘要由CSDN通过智能技术生成

本文是对于medium上Boris博主的一篇文章的学习笔记,这篇文章中利用了生成对抗性网络(GAN)预测股票价格的变动,其中长短期记忆网络LSTM是生成器,卷积神经网络CNN是鉴别器,使用贝叶斯优化(以及高斯过程)和深度强化学习(DRL)优化模型中超参数。此外,文章中非常完整地实现了从特征抽取、模型建立、参数优化、实现预测的过程,其中运用了多种机器学习方法,比如BERT进行文本情绪分析、傅里叶变换提取总体趋势、autoencoder识别高级特征、XGboost实现特征重要性排序等。本文学习的思路是:GAN算法概览 – 项目思路 – 项目详解。拟在学习完成后,在Bigquant平台上尝试实现GAN算法预测股价走势。

1 GAN算法概览

GAN(Generative Adversarial Networks)生成式对抗网络,顾名思义,是通过对抗的方式学习数据分布的生成式模型。所谓对抗,指的是生成网络和判别网络的互相对抗。生成网络尽可能生成逼真的样本,判别网络尽可能去分析该样本是真实的还是生成的。GAN的目的是通过这种对抗博弈得到效果良好的生成式网络,从而应用于图像生成、语音生成、视频生成等,如近期很火的“AI换头”就可能运用了GAN生成可接受的“另一副面孔”。GAN的具体示意如下:

img

ZZ为隐变量,是随机噪声通常服从高斯分布。ZZ通过生成器generator生成XfakeXfake,判别器discriminator分辨输入的数据是生成样本XfakeXfake还是真实样本XrealXreal。模型训练的目标为尽可能使得XrealXreal和XfakeXfake的分布相似,如果以距离来衡量就是两个分布间距离最小,如可以交叉熵来表示:

img

训练时,生成器和判别器采取交替训练,即先训练判别器再训练生成器,直到两者收敛到纳什均衡,即真实和生成样本预测概率均为1/2,难以区分。

从GAN算法的原理可以看出它主要应用于生成新的对象,如创建现实图像、绘画、音频和视频。那这样的生成式模型如何被应用于股价走势这种时间序列预测呢?

背后的逻辑在于一个假设:“历史可以重演”。市场不是100%随机的,股价未来的模式和行为应该或多或少是相同的(除非它开始以一种完全不同的方式运作,或者经济发生剧烈变化)。因此,文章作者希望为未来“生成”与已有的历史交易数据分布类似(当然不是完全相同)的数据,以此来预测股价走势。

这是一种对于市场有效性的自信,并且原文作者在2010年1月1日至2018年12月31日的(训练集7年,测试集2年)美股“Goldman Sachs(高盛)”股票上做了尝试,效果还是很好的。

2 股价预测思路

  • 2
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值