LSTM算法计算机配置,人工智能之机器学习记忆神经网络LSTM算法解析

最新推荐文章于 2024-02-19 10:55:48 发布

weixin_39621044

最新推荐文章于 2024-02-19 10:55:48 发布

阅读量600

点赞数

文章标签： LSTM算法计算机配置

前言：人工智能之机器学习主要有三大类：1)分类；2)回归；3)聚类。今天我们重点探讨一下长短时记忆神经网络(LSTM)算法。

我们知道，RNN是一类功能强大的人工神经网络算法，RNN一个重要的优点在于，其能够在输入和输出序列之间的映射过程中利用上下文相关信息。但是RNN存在着梯度消失或梯度爆炸等问题。因此，为了解决上述问题，长短时记忆神经网络(LSTM)诞生了。

长短期记忆神经网络LSTM是一种特殊的RNN，能够学习长期依赖关系。由Hochreiter和Schmidhuber (1997)提出，在后期工作中又由许多人进行了调整和普及(除了原始作者之外，许多人为现代LSTM做出了贡献，不完全统计：Felix Gers(目前在谷歌的DeepMind任职)， Fred Cummins， Santiago Fernandez， Felix Gers(发明了LSTM遗忘门)，JusTIn Bayer(自动演化)， Daan Wierstra， Julian Togelius， FausTIan Gomez， Matteo Gagliolo 和 Alex Graves)。LSTM在大量问题上效果异常出色，现在正在广泛使用。

LTSM概念：

长短时记忆神经网络LSTM(Long Short–Term Memory)是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。

与其说长短时记忆神经网络LSTM是一种循环神经网络，倒不如说是一个加强版的组件被放在了循环神经网络中。具体地说，就是把循环神经网络中隐含层的小圆圈换成长短时记忆的模块，如下图所示。

LTSM本质：

LSTM引入自循环的巧妙构思，以产生梯度长时间持续流动的路径是初始LSTM模型的核心贡献。其中一个关键扩展是使自循环的权重视上下文而定，而不是固定的。门控此自循环(由另一个隐藏单元控制)的权重，累积的时间尺度可以动态地改变。

LSTM循环网络除了外部的RNN循环外，还具有内部的LSTM细胞循环(自环)。

LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力。

LSTM原理：

LSTM区别于RNN的地方，主要就在于它在算法中加入了一个判断信息有用与否的“处理器”，这个处理器作用的结构被称为cell。

一个cell当中被放置了三扇门，分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中，可以根据规则来判断是否有用。只有符合算法认证的信息才会留下，不符的信息则通过遗忘门被遗忘。

说起来无非就是一进二出的工作原理，却可以在反复运算下解决神经网络中长期存在的大问题。目前已经证明，LSTM是解决长序依赖问题的有效技术，并且这种技术的普适性非常高，导致带来的可能性变化非常多。各研究者根据LSTM纷纷提出了自己的变量版本，这就让LSTM可以处理千变万化的垂直问题。

weixin_39621044

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫