LSTM与GRU

最后的菜鸡

已于 2023-12-19 15:13:18 修改

阅读量127

点赞数 7

文章标签： lstm gru 人工智能深度学习 rnn

于 2023-12-18 11:24:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43248104/article/details/135056750

版权

LSTM与GRU

长短时间记忆网络
为什么分别使用sigma与tanh？
在门上增加窥视孔
整合遗忘门和输入门
GRU

长短时间记忆网络

RNN的反馈特性使得它能记住短时间的信息，但不能记忆较远时间的信息，LSTM可以
LSTM分为记忆门，遗忘门，输出门，
在这里插入图片描述
如图所示：
遗忘门：
$f_{t}=\sigma(W_{f}[h_{t-1}，x_{t}]+b_{f})$
记忆门：
$i_{t}=\sigma(W_{i}[h_{t-1}，x_{t}]+b_{i})$
$C^{\sim}_{t}=\tanh(W_{c}[h_{t-1}，x_{t}]+b_{c})$
更新细胞状态：
$C_{t}=f_{t}*C_{t-1}+ i_{t}*C^{\sim}_{t}$
输出门：
$O_{t}=\sigma(W_{o}[h_{t-1}，x_{t}]+b_{o})$
$h_{t}=o_{t}*\tanh(C_{t})$

为什么分别使用sigma与tanh？

sigmoid函数用于门的开关控制，tanh函数用于生成候选值

在门上增加窥视孔

在这里插入图片描述

这是2000年Gers和Schemidhuber教授提出的一种LSTM变体。图中，在传统的LSTM结构基础上，每个门（遗忘门、记忆门和输出门）增加了一个“窥视孔”（Peephole），有的学者在使用时也选择只对部分门加入窥视孔。

整合遗忘门和输入门

在这里插入图片描述

与传统的LSTM不同的是，这个变体不需要分开来确定要被遗忘和记住的信息，采用一个结构搞定。在遗忘门的输出信号值（0到1之间）上，用1减去该数值来作为记忆门的状态选择，表示只更新需要被遗忘的那些信息的状态。

GRU

改进比较大的一个LSTM变体叫Gated Recurrent Unit (GRU)，目前应用较多。结构图如下
在这里插入图片描述

GRU主要包含2个门：重置门和更新门。GRU混合了细胞状态和隐藏状态为一个新的状态，使用 $h_{t}$ 来表示。该模型比传统的标准LSTM模型简单。
重置门：

$r_{t}=\sigma(W_{r}[h_{t-1}，x_{t}])$
$h^{\sim}_{t}=\tanh(W_{h}[r_{t-1}*h_{t-1}，x_{t}])$

更新门：

$z_{t}=\sigma(W_{z}[h_{t-1}，x_{t}])$
$h_{t}=(1-z_{t})*h_{t-1}+z_{t}*h^{\sim}_{t}$

最后的菜鸡

关注

7
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LSTM与GRU

图中，在传统的LSTM结构基础上，每个门（遗忘门、记忆门和输出门）增加了一个“窥视孔”（Peephole），有的学者在使用时也选择只对部分门加入窥视孔。与传统的LSTM不同的是，这个变体不需要分开来确定要被遗忘和记住的信息，采用一个结构搞定。在遗忘门的输出信号值（0到1之间）上，用1减去该数值来作为记忆门的状态选择，表示只更新需要被遗忘的那些信息的状态。RNN的反馈特性使得它能记住短时间的信息，但不能记忆较远时间的信息，LSTM可以。该模型比传统的标准LSTM模型简单。LSTM分为记忆门，遗忘门，输出门，
复制链接

扫一扫

最后的菜鸡 CSDN认证博客专家 CSDN认证企业博客

码龄6年

32: 原创

38万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

402: 积分

274: 粉丝

59: 获赞

27: 评论

122: 收藏

私信

关注

热门文章

最新评论

MMDetection 3.x使用多GPU训练
L闰土: 请问如果debug train.py脚本，是否可以指定在某个GPU上调试？如果可以的话该怎么操作呢
自动xml转txt，最简单，不报错
hhhhhhswug: 请问代码运行没有报错，但是没有输出TXT文件怎么回事
自动xml转txt，最简单，不报错
hhhhhhswug: 为什么我的不行
自动xml转txt，最简单，不报错
星花*: 感谢博主，挺方便的，转换出来的都正好
MMDetection 3.x使用多GPU训练
Chy.ing: 请问train.py文件中cfg.auto_resume = args.auto_resume if args.gpus is not None: cfg.gpu_ids = range(1) warnings.warn('`--gpus` is deprecated because we only support ' 'single GPU mode in non-distributed training. ' 'Use `gpus=1` now.') if args.gpu_ids is not None: cfg.gpu_ids = args.gpu_ids[0:1] warnings.warn('`--gpu-ids` is deprecated, please use `--gpu-id`. ' 'Because we only support single GPU mode in ' 'non-distributed training. Use the first GPU ' 'in `gpu_ids` now.') if args.gpus is None and args.gpu_ids is None: cfg.gpu_ids = [args.gpu_id]。还能用文中方法吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。