深度学习（二十二）：GRU与LSTM

最新推荐文章于 2024-06-19 16:36:01 发布

打不死的小黑

最新推荐文章于 2024-06-19 16:36:01 发布

阅读量596

点赞数

分类专栏：深度学习 NLP 文章标签： GRU LSTM RNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hzk1562110692/article/details/90139877

版权

深度学习同时被 2 个专栏收录

10 篇文章 3 订阅

订阅专栏

6 篇文章 2 订阅

订阅专栏

这是一系列深度学习的介绍，本文不会涉及公式推导，主要是一些算法思想的随笔记录。
适用人群：深度学习初学者，转AI的开发人员。
编程语言：Python
参考资料：吴恩达老师的深度学习系列视频
 吴恩达老师深度学习笔记整理
唐宇迪深度学习入门视频课程
深度学习500问
笔记下载：深度学习个人笔记完整版

上节课提到了RNN网络的两个缺点，1.计算量太大，不必要记住离自己太远的信息，即不擅长捕获长期依赖关系；2.计算过程中可能会梯度消失，从输出y_hat得到的梯度很难传播回去，很难影响靠前层的权重。

对于梯度爆炸问题，可以借助梯度修剪，即观察梯度向量，如果它大于某个阈值，缩放梯度向量，保证它不会太大，这就是通过一些最大值来修剪的方法。所以如果你遇到了梯度爆炸，如果导数值很大，或者出现了NaN，就用梯度修剪，这是相对比较鲁棒的，这是梯度爆炸的解决方法。然而梯度消失更难解决，比较棘手。我们接下来会介绍GRU，门控循环单元网络，这个网络可以有效地解决梯度消失的问题，并且能够使你的神经网络捕获更长的长期依赖。

GRU单元（Gated Recurrent Unit）

在这里插入图片描述

长短期记忆LSTM（long short term memory）

RNN的升级——LSTM
long short term memory 长短期记忆网络

LSTM网络比较复杂，核心是利用C来决定如何更新

C:控制参数通过训练得到决定什么样的信息会被保留，什么样的会被遗忘
在这里插入图片描述
可以通过门单元处理门是一种让信息选择式通过的方法

更新细胞状态

整体网络：

LTSM步骤:
1.确定丢弃信息
2.确定更新信息
3.更新细胞状态
4.产生输出

GRU与LSTM的比较

GRU和LSTM的性能在很多任务上不分伯仲。
GRU 参数更少因此更容易收敛，但是数据集很大的情况下，LSTM表达性能更好。
从结构上来说，GRU只有两个门（update和reset），LSTM有三个门（forget，input，output），GRU直接将hidden state 传给下一个单元，而LSTM则用memory cell 把hidden state 包装起来。

打不死的小黑

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习（二十二）：GRU与LSTM

这是一系列深度学习的介绍，本文不会涉及公式推导，主要是一些算法思想的随笔记录。适用人群：深度学习初学者，转AI的开发人员。编程语言：Python参考资料：吴恩达老师的深度学习系列视频吴恩达老师深度学习笔记整理唐宇迪深度学习入门视频课程深度学习500问笔记下载：深度学习个人笔记完整版GRU单元（Gated Recurrent Unit）首先我们要明确什么是序列数据，摘取百度百科词条...
复制链接

扫一扫

专栏目录

打不死的小黑

博客等级

码龄12年

126
原创

182
点赞

451
收藏

132
粉丝

关注

私信

热门文章

分类专栏

最新评论

Web容器（一）：Web容器简介
@LucyLi: 这几张配图看着真舒服
iframe,window,滚动条的一些问题
liyichao_: 23
ReplyingKafkaTemplate的使用——Spring结合Kafka实现同步调用
上学下达: 您好，按照您文章中的配置，启动时报错信息如下： java.lang.IllegalStateException: a KafkaTemplate is required to support replies 请问您那是否遇到过这个问题？谢谢
《富爸爸穷爸爸》读书笔记（四）
九月茅: 书籍是本好书籍的，最好的创效小说之一；况且读书做笔记是一件很好的事情，可以记录当时的玲思妙想，一瞬间的灵感。
ReplyingKafkaTemplate的使用——Spring结合Kafka实现同步调用
——春风十里: 楼主，请教个问题，我看了 ReplyingKafkaTemplate 的源码，发现它在启动 replyContainer 时，是在 SmartLifecycle 的 start 方法中，而不是 InitializingBean 的 afterPropertiesSet 方法中。当Spring容器加载所有bean并完成初始化之后会接着回调 SmartLifecycle 的 start 方法，但是这样就会造成一个问题，如果想在其他类的初始化过程（afterPropertiesSet）中通过 kafka 进行通讯，就会立刻抛出一个异常：Template has not been start()ed。因为 replyContainer 还未启动，这是我不能理解的，不明白 replyContainer 为什么非要在所有 bean 初始化完后才启动。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。