lstm网络_LSTM网络理解及其参数计算

本文介绍了LSTM(长短期记忆网络)的核心思想,包括忘记门、存储门、更新层和输出值的概念,阐述了如何通过门结构控制细胞状态来处理长期依赖问题。同时,总结了LSTM的关键参数计算,指出LSTM相比RNN在许多任务中展现出更好的性能,并提及了双向LSTM以解决只能向前传递信息的局限。
摘要由CSDN通过智能技术生成

前篇文章我们讲过RNN网络,RNN网络可以理解当前任务以前的信息,但是却不能长期记忆,比如在经过4-5个神经元网络的计算之后,包留之前信息的权重就变得很小。之前信息对当前信息的影响就变得很小。这个时候就可以用到LSTM(Long Short Term)网络,相比于RNN网络,他可以更好的记住很久之前我们需要的信息。

711fd3ff63bd858c9a518272654f1a79.png
RNN展开

LSTM 由Hochreiter & Schmidhuber (1997)提出,并在近期被Alex Graves进行了改良和推广。在很多问题,LSTM 都取得相当巨大的成功,并得到了广泛的使用。LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为,而非需要付出很大代价才能获得的能力!

所有 RNN 都具有一种重复神经网络模块的链式的形式。在标准的 RNN 中,这个重复的模块只有一个非常简单的结构,例如一个tanh层。

所有 RNN 都具有一种重复神经网络模块的链式的形式。在标准的 RNN 中,这个重复的模块只有一个非常简单的结构,例如一个tanh层。

3f55f967b8eb8a7db8b87f26a938c0de.png
RNN内部

LSTM 同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于 单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。

696403dcb638443dc862d420c6a98a5f.png
LSTM内部四个交互层

8f5437e498665631b707544b6f55b9f9.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值