lstm数学推导_深度学习中的参数梯度推导(五)上篇

本文介绍了LSTM模型,作为RNN的变种,它通过特殊的门控结构解决梯度消失问题,适用于长序列数据处理。内容涵盖了LSTM的细胞状态、遗忘门、输入门、输出门的运作机制以及前向传播算法。
摘要由CSDN通过智能技术生成

前言

在循环神经网络(RNN)模型与前向反向传播算法中,我们总结了对RNN模型做了总结。由于RNN也有梯度消失的问题,因此很难处理长序列的数据,大牛们对RNN做了改进,得到了RNN的特例LSTM(Long Short-Term Memory),它可以避免常规RNN的梯度消失,因此在工业界得到了广泛的应用。下面我们就对LSTM模型做一个总结。

5.1

LSTM的前传

4e13cd720c27fddfe3eea8493ece101f.png 577d1449be62acef22eeba27cabbbcea.png 926b81609a88351b3397b4401b8c8c40.png 7c2bb3e5e28addfcd2ca95e058a4409d.png c542b750987c091d2b996fa818a95e13.png

由于RNN梯度消失的问题,大牛们对于序列索引位置t的隐藏结构做了改进,可以说通过一些技巧让隐藏结构复杂了起来,来避免梯度消失的问题,这样的特殊RNN就是我们的LSTM。由于LSTM有很多的变种,这里我们以最常见的LSTM为例讲述。LSTM的结构如下图:

f5f82f0b3c0f774987e730337779a898.png

5.1.1 LSTM之细胞状态

上面我们给出了LSTM的模型结构,下面我们就一点点的剖析LSTM模型在每个序列索引位置t时刻的内部结构。

0af72fdef3e5867be27046d3e9b19ced.png 13920453f0601f1689297309bcfa9b5a.png c24c8959f6be026fb83d6a8173e47cd5.png

除了细胞状态,LSTM图中还有了很多奇怪的结构,这些结构一般称之为门控结构(Gate)。LSTM在在每个序列索引位置t的门一般包括遗忘门,输入门和输出门三种。下面我们就来研究上图中LSTM的遗忘门,输入门和输出门以及细胞状态。

5.1.2 LSTM之遗忘门

遗忘门(forget gate)顾名思义,是控制是否遗忘的,在LSTM中即以一定的概率控制是否遗忘上一层的隐藏细胞状态。遗忘门子结构如下图所示:

b2a5d551ccf3a2167b9518538181568a.png d4dee1c5269207258b3909c81daf10a7.png

5.1.3 LSTM之输入门

输入门(input gate)负责管理当前序列位置的输入,它的子结构如下图:

0d98dd5387db86fce0698ce938e9bacd.png 8c445ef135af2037f18570bd47e61b51.png

5.1.4 LSTM之细胞状态更新

479dfc7203797a2284b9f01a726521a2.png d6cf701f91b540f98646612e0c9669d6.png 07f7a99e71283d696fe278dc3368c3fe.png

5.1.5 LSTM之输出门

a1215b5fcf4c181e3c0233b6043717d1.png b91b9c32244ad6bc72d3ed15e9570b75.png a64b8e7a7837297a7554a9df388098d0.png

5.1.6 LSTM前向传播算法

047956f42e1114c30dcfdc0c64f5a0d8.png

参考资料

https://www.cnblogs.com/sumwailiu/p/13623985.html

https://www.zhihu.com/question/34878706/answer/665429718

https://weberna.github.io/blog/2017/11/15/LSTM-Vanishing-Gradients.html

https://www.cnblogs.com/pinard/p/6519110.html

深度学习

TO BE CONTINUED

数学

文章作者: 中国电信研究院 | 刘心唯

文章内容系作者个人观点,不代表融智未来公众号的观点或立场。

往期 · 推荐

● 深度学习中的参数梯度推导(一)上篇

● 深度学习中的参数梯度推导(三)上篇

● 深度学习中的参数梯度推导(三)中篇

● 深度学习中的参数梯度推导(三)下篇

● 深度学习中的参数梯度推导(四):vanilla RNN的前传与反传

b5addbd3eae6e9a00ab48e47f4ecd048.png f3f42fc6b323c2b953551d11d7cbfcf7.png

你们点点“分享”,给我充点儿电吧~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值