DL - LSTM

小田_

于 2021-05-10 18:51:38 发布

阅读量167

点赞数

分类专栏： DL 深度学习 NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45390999/article/details/116605540

版权

NLP 同时被 2 个专栏收录

26 篇文章 5 订阅

订阅专栏

DL 深度学习

10 篇文章 0 订阅

订阅专栏

文章目录

LSTM 长短记忆网络

LSTM 长短记忆网络

LSTM 是 RNN 的升级版，应用更广泛。

解决的问题：

增加控制参数C，保留有价值的信息；

C 可以看做一个权重列表：[0, 0.1, 0.8, 1] 舍弃，小部分保留，大部分保留，全部保留。

LSTM 的重点是控制参数怎么更新

如何训练C参数？

门是一种让信息选择式通过的方法
Sigmoid 神经网络层和一乘法操作

Sigmoid 公式：
$\frac{1}{1 + e^{-z}}$

Sigmoid 在负无穷到正无穷的范围类，数值在 0–1 之间；
描述每个部分多少量可以通过，0代表不允许任何量通过，1 代表允许任何量通过。

1、决定丢弃信息

$h_{t-1}$ ：上一层中间结果；
$x_t$ ：当前数据；
$\sigma$ ：激活函数；
$f_t$ ：所有值在 0-1 范围之间。 $f_t$ 和 $C_{t-1}$ 组合，乘法操作，决定丢弃什么信息。

$ f_{t}=\sigma (W_{f} \cdot [h_{t-1}, x_{t} ]+b_{f} )$

2、确定要更新的信息

$i_{t}$ 要保留下来的新信息
$C_{t}$ 新数据形成的控制参数

$i_{t} = \sigma (W_{i} \cdot [h_{t-1}, x_{t} ] + b_{i} ) $

$\tilde{C}_{t} = \tanh (W_{C} \cdot [h_{t-1}, x_{t}]+b_{C} )$

3、更新细胞状态

$C_{t} = f_t * C_{t-1} + i_t * \tilde{C}_{t} $

4、输出信息

$o_t$ ：什么都没忘，全留下的信息
$h_t$ ：输出值
$C_t$ ：更新完的结果

$o_t = \sigma (W_o [h_{t-1}, x_t] + b_o)$

$h_t = o_t * tanh(C_t)$

参考资料

零基础入门深度学习(6) - 长短时记忆网络(LSTM)
https://zybuluo.com/hanbingtao/note/581764

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DL - LSTM

文章目录LSTM 长短记忆网络如何训练C参数？1、决定丢弃信息2、确定要更新的信息3、更新细胞状态4、输出信息参考资料LSTM 长短记忆网络LSTM 是 RNN 的升级版，应用更广泛。解决的问题：增加控制参数C，保留有价值的信息；C 可以看做一个权重列表：[0, 0.1, 0.8, 1] 舍弃，小部分保留，大部分保留，全部保留。LSTM 的重点是控制参数怎么更新如何训练C参数？门是一种让信息选择式通过的方法Sigmoid 神经网络层和一乘法操作Sigmoid 公式：g(z)=11
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。