NNDL 作业10：第六章课后题（LSTM | GRU）

最新推荐文章于 2023-09-19 15:02:21 发布

五元钱

最新推荐文章于 2023-09-19 15:02:21 发布

阅读量381

点赞数 1

分类专栏：深度学习作业文章标签： lstm gru 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52086410/article/details/128068136

版权

深度学习作业专栏收录该内容

12 篇文章 0 订阅

订阅专栏

目录

习题6-3 当使用公式(6.50)作为循环神经网络得状态更新公式时，分析其可能存在梯度爆炸的原因并给出解决办法.

习题6-4 推导LSTM网络中参数的梯度，并分析其避免梯度消失的效果编辑

习题6-5 推导GRU网络中参数的梯度，并分析其避免梯度消失的效果

习题6-3 当使用公式(6.50)作为循环神经网络得状态更新公式时，分析其可能存在梯度爆炸的原因并给出解决办法.

公式(6.50)为： $h_{t}=h_{t-1}+g(x_{t},h_{t-1};\Theta )$

在公式 $Z_k=Uh_{k-1}+W_{x_k}+b$ 为在第K时刻函数g(*)的输入，在计算公式（6.34）中的误差项时，梯度可能过大，从而导致梯度爆炸问题。

解决办法：增加门控装置，使用LSTM网络。

习题6-4 推导LSTM网络中参数的梯度，并分析其避免梯度消失的效果编辑

手动推导

避免梯度消失的效果

这只是一步的推导，如果是多个时间步，就是多个类似公式的累乘。从这一步的结果中我们可以发现，其结果的取值范围并不一定局限在[0,1]中，而是有可能大于1的。这个由LSTM自身的权值决定，依靠学习得到权值去控制依赖的长度，这便是LSTM缓解梯度消失的真相。综上可以总结为两个事实：

1、cell state传播函数中的“加法”结构确实起了一定作用，它使得导数有可能大于1；
2、LSTM中逻辑门的参数可以一定程度控制不同时间步梯度消失的程度。

习题6-5 推导GRU网络中参数的梯度，并分析其避免梯度消失的效果

GRU它引⼊了重置⻔（reset gate）和更新⻔（update gate) 的概念，从而修改了循环神经⽹络中隐藏状态的计算⽅式。

在这里插入图片描述

在这里插入图片描述

LSTM与GRU二者结构十分相似，不同在于：

新的记忆都是根据之前状态及输入进行计算，但是GRU中有一个重置门控制之前状态的进入量，而在LSTM里没有类似门；
产生新的状态方式不同，LSTM有两个不同的门，分别是遗忘门(forget gate)和输入门(input gate)，而GRU只有一种更新门(update gate)；
LSTM对新产生的状态可以通过输出门(output gate)进行调节，而GRU对输出无任何调节。

GRU的优点是这是个更加简单的模型，所以更容易创建一个更大的网络，而且它只有两个门，在计算性上也运行得更快，然后它可以扩大模型的规模。

参考

为什么LSTM可以缓解梯度消失？

解决梯度消失梯度爆炸强力推荐的一个算法-----GRU（门控循环神经⽹络）

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NNDL 作业10：第六章课后题（LSTM | GRU）

第六章课后题（LSTM | GRU）
复制链接

扫一扫

专栏目录

五元钱 CSDN认证博客专家 CSDN认证企业博客

码龄4年

28: 原创

131万+: 周排名

209万+: 总排名

9766: 访问

: 等级

330: 积分

16: 粉丝

46: 获赞

6: 评论

29: 收藏

私信

关注

热门文章

分类专栏

深度学习作业 12篇
深度学习 16篇

最新评论

NNDL 实验五前馈神经网络（3）鸢尾花分类
竹煌: 您好，请问一下我安装nndl库时，显示在pypi当中没有找到该库怎么办呢
NNDL 实验五前馈神经网络（1）二分类任务
qq_46047351: 大佬…nndl库在哪里下载吖
NNDL 实验六卷积神经网络（5）使用预训练resnet18实现CIFAR-10分类
weixin_58836070: “”预训练模型是深度学习架构，已经过训练以执行大量数据上的特定任务”中的“已经过训练”是什么意思？（来自深度学习小白的疑问）
NNDL 实验一 numpy
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。