LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

https://www.toutiao.com/a6682630826011656711/

 

 2019-04-22 16:20:36

哈喽,大家好!我,人称神秘小马哥又回来了,不知道大家还记不记得上期我的秘密三叉戟,轻松力压股市三大指数。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

这期我给大家解密一下我三叉戟的第一根利器,LSTM模型,它在股价预测中更优于传统计量模型,并在语音识别,语言翻译和智能营销等领域,也显示了其强大力量。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

 

1、解剖LSTM模型

LSTM模型是RNN模型的一个特殊例子,那RNN模型又是怎么一回事呢,别急,待我细细道来。RNN模型最主要的特性,即当前时间的状态不仅受到当前信息的影响,还受到之前状态的影响,我们先来看看下面这个结构:

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表1 RNN结构

假设图中A为一段语音序列,X即表示这段语音中的一句话所含的信息,则第二句话不仅受自身所含信息X1的影响,还取决于第一句话所带的隐藏状态h0的影响。正因为此特性,RNN能够记忆序列本身信息,但因为RNN本身机制的设计,易导致严重的梯度爆炸和梯度消失问题(信息爆炸和后续信息丢失),从而记忆不了太长时间段信息,而且对内存和计算时间要求也高。鉴于此,LSTM提出了三扇“门”,遗忘门,输入门,输出门来解决RNN存在的问题。“遗忘门”——忘记部分过去的信息,“输入门”——记住部分现在的信息,然后将过去的记忆与现在的记忆合并后通过“输出门”——决定最终输出的部分。咦,人生不也如此嘛,忘记过去不开心的事情,记住当下美好的事物,才能生活的更美好(哎呀,一不小心,小马我撒了一下鸡汤,见谅)。下面我们言归正传,LSTM模型处理过程可如下图所示,Ct-1为上一阶段的信息状态,ht-1为上一阶段的隐藏状态,Xt为当前阶段所提供的信息。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表2遗忘门过程

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表3输入门过程

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表4细胞状态更新

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表5输出门过程

以便大家理解,我再来给大家举个栗子,比如识别一段语音,X为其中一句话,我们在识别这句话时,会利用上一句话的信息帮助识别。假设上一句话的信息包含主题的性别,但此时这句话的信息中出现了新的性别,这时候“遗忘门”就起作用了,它会删去上句话中旧的主题性别,同时 “输入门”会更新新的主题性别。这样,当前信息状态即可得到一句新的输入。最终我们通过“输出门”决定输出哪部分信息,考虑到主题后可能出现的动词,它可能会输出主题的单复数信息,以便知道如何与动词结合在一起。通过对前期信息有选择的记忆和遗忘,LSTM实现了对相关信息的长期记忆,从而提取了时间特征。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

 

2、LSTM模型的用武之地

LSTM模型的神秘力量现在已经被运用于多个场景中,指数预测,语音识别,精准营销,哪哪儿都少不了它的身影,下面我给大家一一简单讲述一下。

 

2.1上证综指指数收益率预测

首先,先让我给你们讲讲我小马是如何用它的,以上证综指为例,我将其最高价,最低价,开盘价以及成交量和各类市值指标数据喂入模型,来预测其5日价格变动。此价格变动可为投资提供仓位和买卖时点的参考,具有很强的应用价值。我选取2016年1月1日到2018年9月13日的数据作为训练样本,2018年09与14日到2019年1月4日的数据作为测试样本。众所周知,A股市场在17年迎来了投资风格转变的一年,小盘股风光不再,而大盘股开始春风得意,如图6所示。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表6 指数走势

因此我们选择2016年到2019年3年数据,横跨两类投资风格,测试其对大盘指数收益率的预测效果,效果如下图。可见LSTM模型相较于传统线性模型ARIMAX对上证综指指数收益率的拟合轻松取得胜利。

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表7 上证综指收益率预测

 

2.2语音识别

在语音识别方面,LSTM也是风头正劲。2018年谷歌老大哥发布了一新型全神经移动端 Gboard 语音识别器,其首先用于所有使用美式英语的 Pixel 手机。其中预测网络和编码器网络是 LSTM RNN,联合模型是前馈网络,这将谷歌语音的性能提升了50%。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表8 谷歌识别相同的语音句子时将服务器端语音识别器(左侧面板)与新型移动端识别器(右侧面板)进行对

 

2.3语言翻译

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表9 谷歌GNMT翻译机架构

 

2016年,谷歌(又是它,崇拜脸)

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

推出了其神经网络翻译系统(GNMT)。其在GNMT中,其编码层和解码层也都为LSTM结构。共有9层LSTM堆叠。其效果远好于当时最好水平的PBMT翻译系统,且在不同的任务翻译中,GNMT都已经接近人类专家水平。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表10 PNMT翻译准确率

 

2.4精准营销

UBT(User Behavior Tracking)即用户行为数据跟踪是LSTM模型的另一大主场。UBT即记录用户在APP上的各类行为,包括设备、网络情况,软件环、地理位置分布、操作习惯等,数据具有非常大的挖掘价值,但同时挖掘难度也很大。相比于传统的建模方式(数据准备 -> 特征提取 -> 模型训练),LSTM模型不仅能抓住某些特定的操作模式,还能记住用户历史的操作行为,在UBT这种和时间序列相关的案例中LSTM模型完胜。

以某信贷产品精准营销为例,LSTM模型以该产品现有借款用户在APP上的海量数据来训练,根据其是否逾期的表现,得到对用户风险评估有较好区分度的风险模型。该模型对此产品申请借款用户实现了很好的风险区分度。

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

图表11 某信贷产品LSTM精准营销框架

听完我的碎碎念,相信大家现在对LSTM模型有了一个大概的了解了吧。下期我会给大家讲我三叉戟的第二根利器,CNN模型,敬请期待!

 

LSTM-CNN-Attention算法系列之一:LSTM提取时间特征

 

关注兴业数金微信公众号,了解更多金融信息服务。

  • 22
    点赞
  • 137
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
LSTM(Long Short-Term Memory)是一种循环神经网络(RNN)的变体,它在处理时间序列预测任务中表现出色。LSTM在处理长期依赖性和记忆问题方面具有优势,可以捕捉到时间序列中的长期依赖关系。它通过使用门控单元和记忆单元来控制信息的流动和记忆,从而有效地处理输入序列中的时序特征。 针对时间序列预测任务,LSTM通过将时间步作为输入序列的一部分来学习序列之间的模式和关联。在预测时,可以将过去的时间步作为输入,然后使用LSTM模型来预测未来的时间步。这可以用于各种应用,如股票价格预测、气候预测、交通流量预测等。 引用提到了ARIMA-LSTM和AQI预测的组合模型。这种组合模型结合了自回归积分滑动平均模型(ARIMA)和LSTM模型,以提高时间序列预测的准确性和稳定性。ARIMA模型用于处理时间序列的线性趋势和季节性,而LSTM模型则用于捕捉非线性和长期依赖关系。这种组合模型的使用可以充分利用两种模型的优势,提高预测性能。 引用提到了MATLAB实现的CNN-LSTM模型用于时间序列预测。这种模型结合了卷积神经网络(CNN)和LSTM,用于处理时间序列数据。CNN用于提取时间序列中的空间特征,而LSTM则用于捕捉序列中的时序特征。这种模型可以有效地处理单变量时间序列数据,并具有较好的预测性能。 因此,LSTM模型在时间序列预测中被广泛应用,并且可以与其他模型进行组合或结合其他技术(如CNN)以提高预测准确性。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值