lstm网络_LSTM网络理解及其参数计算

最新推荐文章于 2024-08-11 12:10:46 发布

weixin_39669638

最新推荐文章于 2024-08-11 12:10:46 发布

阅读量1.2k

点赞数

文章标签： lstm网络 lstm需要优化的参数

本文介绍了LSTM（长短期记忆网络）的核心思想，包括忘记门、存储门、更新层和输出值的概念，阐述了如何通过门结构控制细胞状态来处理长期依赖问题。同时，总结了LSTM的关键参数计算，指出LSTM相比RNN在许多任务中展现出更好的性能，并提及了双向LSTM以解决只能向前传递信息的局限。

摘要由CSDN通过智能技术生成

前篇文章我们讲过RNN网络，RNN网络可以理解当前任务以前的信息，但是却不能长期记忆，比如在经过4-5个神经元网络的计算之后，包留之前信息的权重就变得很小。之前信息对当前信息的影响就变得很小。这个时候就可以用到LSTM（Long Short Term）网络，相比于RNN网络，他可以更好的记住很久之前我们需要的信息。

RNN展开

LSTM 由Hochreiter & Schmidhuber (1997)提出，并在近期被Alex Graves进行了改良和推广。在很多问题，LSTM 都取得相当巨大的成功，并得到了广泛的使用。LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力！

所有 RNN 都具有一种重复神经网络模块的链式的形式。在标准的 RNN 中，这个重复的模块只有一个非常简单的结构，例如一个tanh层。

所有 RNN 都具有一种重复神经网络模块的链式的形式。在标准的 RNN 中，这个重复的模块只有一个非常简单的结构，例如一个tanh层。

RNN内部

LSTM 同样是这样的结构，但是重复的模块拥有一个不同的结构。不同于单一神经网络层，这里是有四个，以一种非常特殊的方式进行交互。

LSTM内部四个交互层

最低0.47元/天解锁文章

weixin_39669638

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。