CS224d lecture08 GRU和LSTM

最新推荐文章于 2023-12-26 15:43:49 发布

Xiao_yanling

最新推荐文章于 2023-12-26 15:43:49 发布

阅读量167

点赞数

分类专栏： CS224

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xiao_yanling/article/details/93377910

版权

CS224 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

GRU

GRU中含有更新门和重置门（计算中得到的最后形式是向量，通过将输入或隐状态相乘，重置门决定了如何把新的输入与之前的记忆相结合，更新门决定多少先前的记忆起作用。），重置门和更新门能够起到解决梯度消失问题的作用。

更新门：
$z_t=\sigma(W^{(z)}x_t+U^{(z)}h_{t-1})$

重置门：
$r_t=\sigma(W^{(r)}x_t+U^{(r)}h_{t-1}$

在这里插入图片描述

LSTM（Long Short-term Memory/长短期记忆）

原理：

门：输入门、遗忘门、输出门
在这里插入图片描述
$\delta$ ： $S i g m o i d$ 函数，值域为【0,1】，用于决定遗忘多少信息，0：全部遗忘，1：全部记住。
$h_t$ ：细胞的输出
$x_t$ ：当前输入
$C_t$ ：细胞状态
$W$ ：学习到的权值矩阵

第一步：决定从细胞状态忘记什么信息：
$f_t=\delta(W_f[h_{t-1},x_t]+b_f)$
第二步：决定让多少新的信息加入细胞状态中：
$i_t=\delta(W_i[h_{t-1},x_t]+b_i)$
$t a n h$ 用来生成一个向量，即备选的用来更新的内容：
$\widetilde{C_t}=tanh(W_c[h_{t-1},x_t]+b_C)$
第三步：更新细胞状态
$C_t=f_t*C_{t-1}+i_t*\widetilde{C_t}$
第四步：确定输出（过滤后版本）
$o_t=\delta(W_o[h_{t-1},x_t]+b_o)$
$h_t=o_t*tanh(C_t)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CS224d lecture08 GRU和LSTM

GRUGRU中含有更新门和重置门（计算中得到的最后形式是向量，通过将输入或隐状态相乘，重置门决定了如何把新的输入与之前的记忆相结合，更新门决定多少先前的记忆起作用。），重置门和更新门能够起到解决梯度消失问题的作用。更新门：zt=z_t=zt=重置门：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。