GRU概述

最新推荐文章于 2024-06-19 16:36:01 发布

-Ausen

最新推荐文章于 2024-06-19 16:36:01 发布

阅读量2.7k

点赞数

文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43971116/article/details/105272473

版权

来源：人人都能看懂的GRU - 知乎

GRU

GRU（Gate Recurrent Unit）是循环神经网络（Recurrent Neural Network, RNN）的一种。和LSTM（Long-Short Term Memory）一样，也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

GRU与LSTM在实际表现上相差无几，但是由于GRU更便于计算，更容易进行训练，能够在很大程度上提高模型的训练效率，所以被提出来了。

GRU的输入输出结构

GRU的输入输出结构与普通的RNN是一样的。

当前的输入x_t，上一节点传递下来的隐状态（hidden state）h_t-1，这个隐状态包含了之前节点的相关信息。

结合上面两个数据就可以得到当前节点的输出y_t和传递给下一个节点的隐状态h_t。

GRU的内部结构

首先我们会从上一个节点传递下来的状态h_t-1以及当前的输入x_t来获取两个门控状态，如下图，r控制重置的门控，z为控制更新的门控。

Tips：为 sigmoid函数，通过这个函数可以将数据变换为0-1范围内的数值，从而来充当门控信号。

得到门控信号之后，首先我们先用重置门“重置”h_t-1，，再让h_t-1与x_t进行拼接，再通过一个tanh激活函数来将数据放缩到-1~1的范围中。得到下面h'。

这里的 h' 主要是包含了当前输入的 x_t 数据。有针对性地对 h' 添加到当前的隐藏状态，相当于”记忆了当前时刻的状态“。类似于LSTM的选择记忆阶段。

最后GRU最重要的一个步骤，可以称之为“更新记忆”阶段。

这个阶段我们同时进行记忆和遗忘两个步骤。使用之前得到的门控z。

如果z中的值越靠近0，则对上个cell传过来的状态选择遗忘的越多，对这次的输入生成的h'记忆的越多。

GRU很聪明的一点就在于，我们使用了同一个门控 z 就同时可以进行遗忘和选择记忆（LSTM则要使用多个门控）。 equation?tex=z 转存失败重新上传取消（可以看到这里的遗忘z和选择（z-1）是联动的，就是说我们对于传递过来的信息我们会选择性的遗忘，但是遗忘了多少我们则会通过选择来弥补，这里两个动作是相互平衡的）

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
GRU概述

来源：https://zhuanlan.zhihu.com/p/32481747GRUGRU（Gate Recurrent Unit）是循环神经网络（Recurrent Neural Network, RNN）的一种。和LSTM（Long-Short Term Memory）一样，也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。GRU与LSTM在实际表现上相差无几，但是由于GR...
复制链接

扫一扫

-Ausen CSDN认证博客专家 CSDN认证企业博客

码龄6年

42: 原创

15万+: 周排名

193万+: 总排名

2万+: 访问

: 等级

504: 积分

7: 粉丝

14: 获赞

4: 评论

32: 收藏

私信

关注

热门文章

分类专栏

最新评论

tomcat搭建简单文件服务器
CSDN-Ada助手: 非常感谢您的分享，这篇博客详细介绍了tomcat搭建简单文件服务器的过程，让我们学到了很多。我认为您可以继续写一篇关于如何使用nginx搭建更高效的文件服务器的博客，这对于需要处理大量文件访问的用户来说非常有用。相信您的分享会吸引更多的读者前来阅读。期待您的下一篇技术文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
对TESSERACT: Eliminating Experimental Bias in Malware Classification across Space and Time简单理解
super尚: 博主你好！这篇论文的数据集请问怎么下载呢？我没有权限从他们官网下载
对 Detection of Malicious Code Variants Based on Deep Learning 的简单理解
pancy888: Tracking Learning Detection Code是关于这篇文章的吗
对 Detection of Malicious Code Variants Based on Deep Learning 的简单理解
pancy888: 这个最后的BAT算法部分不是很理解，是崔志华（音）那篇文章吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。