“
本文从处理具有时间依赖的信息出发,介绍了RNN的原理和存在问题,在此基础上引出了LSTM,讨论了LSTM对于解决RNN的长时依赖问题的方法。
作者/编辑:moon
”
Long-short term memory,简称LSTM,被广泛的应用于语音识别、机器翻译、手写识别等。他们由Hochreiter&Schmidhuber引入,并被许多人进行改进和普及。LSTM是一种循环神经网络,具有记忆功能,因此能够将时间序列上的信息关联起来,找出其中的特征。LSTM也是为了解决Recurrent-neural-network(RNN)的困难而提出的。为了深入理解LSTM原理,还是要从RNN讲起。
01
RNN
“
人类并不是每时每刻都从他们空白的大脑开始思考。在你阅读这篇文章的时候,你都是基于自己已经拥有的对所见词的理解来推断当前词的含义的。我们不会将所有的东西都抛弃,然后用空白的大脑来思考。我们的思想具有持久性。RNN解决了这个问题,它是包含循环的神经网络,可以处理随时间变化的信息。
对于具有时序性的数据(比如人的行为),如何在一个相互连接的模型中,有效的表示其时序模式是分析的重点。就以一个人走路姿态为例,一种处理方法是“时间并行化”,即将每个时间点人的姿态作为一个向量,并行送入到传统神经网络中