LSTM原理

本文从RNN的原理及其存在的梯度消失问题出发,详细介绍了LSTM(长短期记忆网络)的设计思路和数学形式,强调LSTM通过门控机制在一定程度上解决了循环神经网络处理长时序数据时的挑战。
摘要由CSDN通过智能技术生成

本文从处理具有时间依赖的信息出发,介绍了RNN的原理和存在问题,在此基础上引出了LSTM,讨论了LSTM对于解决RNN的长时依赖问题的方法。

                                                 作者/编辑:moon

 

Long-short term memory,简称LSTM,被广泛的应用于语音识别、机器翻译、手写识别等。他们由Hochreiter&Schmidhuber引入,并被许多人进行改进和普及。LSTM是一种循环神经网络,具有记忆功能,因此能够将时间序列上的信息关联起来,找出其中的特征。LSTM也是为了解决Recurrent-neural-network(RNN)的困难而提出的。为了深入理解LSTM原理,还是要从RNN讲起。

 

01

RNN

人类并不是每时每刻都从他们空白的大脑开始思考。在你阅读这篇文章的时候,你都是基于自己已经拥有的对所见词的理解来推断当前词的含义的。我们不会将所有的东西都抛弃,然后用空白的大脑来思考。我们的思想具有持久性。RNN解决了这个问题,它是包含循环的神经网络,可以处理随时间变化的信息。

对于具有时序性的数据(比如人的行为),如何在一个相互连接的模型中,有效的表示其时序模式是分析的重点。就以一个人走路姿态为例,一种处理方法是“时间并行化”,即将每个时间点人的姿态作为一个向量,并行送入到传统神经网络中

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值