LSTM中隐层神经元的传播机制

最新推荐文章于 2024-07-21 09:38:39 发布

whitesilence

最新推荐文章于 2024-07-21 09:38:39 发布

阅读量4.5k

点赞数 1

分类专栏： deep-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/whitesilence/article/details/76034718

版权

deep-learning 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

相较于RNN，LSTM只是改变了隐含层中神经元在不同时刻的传播机制
这里写图片描述
将隐层某个神经元看成一个cell, 这个cell有3个输入，上一个时刻的隐层某神经元的保留状态 $C_{t-1}$ ,上一个时刻的隐层某神经元输出的传递信息 $h_{t-1}$ , 当前时刻的样本 $X_t$ , 该cell由3个gate(forget, input, output)控制。

一、通过忘记门决定从cell中丢失什么信息：

$f_t=sigmoid(W_{fh}h_{t-1}+W_{fx}X_t+b_f)$

二、通过输入门决定什么样的新信息被存放在cell中：

决定什么值将要更新：
$i_t=sigmoid(W_{ih}h_{t-1}+W_{ix}X_t+b_i)$

创建新的候选值向量：
$\widetilde{C_t}=tanh(W_{ch}h_{t-1}+W_{cx}X_t+b_c)$

确定更新信息：
$C_t=f_t*C_{t-1}+i_t*\widetilde{C_t}$

三、通过输出门决定输出什么：

决定哪个部分将被输出：
$o_t=sigmoid(W_{oh}h_{t-1}+W_{ox}X_t+b_o)$

确定输出部分：
$h_t=o_t*tanh(C_t)$

本文参考资料http://www.open-open.com/lib/view/open1440843534638.html

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。