GRU详解全网最强大厂面试级深度的知识点整理

Xu_Wave

已于 2022-04-18 00:13:58 修改

阅读量1.2k

点赞数 1

分类专栏： NLP(包含深度学习) 文章标签：自然语言处理

于 2021-02-07 20:03:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22795223/article/details/113746590

版权

NLP(包含深度学习) 专栏收录该内容

55 篇文章 36 订阅

订阅专栏

1. 什么是GRU

GRU（Gate Recurrent Unit）是循环神经网络（Recurrent Neural Network, RNN）的一种。和LSTM（Long-Short Term Memory）一样，也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

GRU和LSTM在很多情况下实际表现上相差无几，那么为什么我们要使用新人**GRU（2014年提出）而不是相对经受了更多考验的LSTM（1997提出）**呢。

引用论文中的一段话来说明GRU的优势所在：
在这里插入图片描述
简单来说就是贫穷限制了我们的计算能力…

相比LSTM，使用GRU能够达到相当的效果，并且相比之下更容易进行训练，能够很大程度上提高训练效率，因此很多时候会更倾向于使用GRU。

OK，那么为什么说GRU更容易进行训练呢，下面开始介绍一下GRU的内部结构。

2. GRU浅析

2.1 GRU的输入输出结构

GRU的输入输出结构与普通的RNN是一样的。
在这里插入图片描述
那么，GRU到底有什么特别之处呢？下面来对它的内部结构进行分析！

2.2 GRU的内部结构

在这里插入图片描述

这里的 $h^{'}$ 主要是包含了当前输入的 $x^t$ 数据。有针对性地将 $h^{'}$ 添加到当前的隐藏状态（下图中 $h^t$ 的计算里包含有 $h^{'}$ ），相当于“记忆了当前时刻的状态”。先看下面的总体的更新公式，再回头记忆这个公式会好记一点。
在这里插入图片描述

GRU必须先看上面的这个更新表达式，然后再对 $h^{'}$ 进行展开理解！！！

3. LSTM与GRU的关系

在这里插入图片描述

4. 总结

GRU输入输出的结构与普通的RNN相似，其中的内部思想与LSTM相似。

与LSTM相比，GRU内部少了一个”门控“，参数比LSTM少，但是却也能够达到与LSTM相当的功能。考虑到硬件的计算能力和时间成本，因而很多时候我们也就会选择更加”实用“的GRU啦。

在实践中，一般认为LSTM和GRU之间并没有明显的优胜者。因为GRU具有较少的参数，所以训练速度快，而且所需要的样本也比较少。而LSTM具有较多的参数，比较适合具有大量样本的情况，可能会获得较优的模型。

在Andrew的课程中表示，如果只能选择一个模型，那么LSTM是大家的default RNN。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
GRU详解全网最强大厂面试级深度的知识点整理

GRU面试整理
复制链接

扫一扫

专栏目录

Xu_Wave CSDN认证博客专家 CSDN认证企业博客

码龄10年

自然语言处理领域新星创作者

113: 原创

9933: 周排名

90万+: 总排名

19万+: 访问

: 等级

3014: 积分

1万+: 粉丝

307: 获赞

62: 评论

1032: 收藏

私信

关注

热门文章

分类专栏

最新评论

Word2Vec原理解析二：层级Softmax与负采样
林北林奈: 似然函数L那里是不是多了对w∈C的求和？因为我们只要让目标词汇所在路径的概率最大，其他的都不考虑啊，显然不应该将所有路径都算入
Word2Vec原理解析一
CSDN-Ada助手: pytorch 的优势是什么？
Transformer-XL详解
weixin_45405814: 请问为何需要 u 和 v 两个向量，而不是用一个就可以了
GloVe最全面、最深度的解析
m0_60066487: 是我看过的中解释最清楚的，赞！
GPT-2及与GPT的对比
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用更多的站内链接；(3)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Xu_Wave 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。