应该能看懂的GRU结构

最新推荐文章于 2024-06-18 17:34:16 发布

dodo可大魔王

最新推荐文章于 2024-06-18 17:34:16 发布

阅读量415

点赞数

文章标签：循环神经网络

本文链接：https://blog.csdn.net/weixin_44108562/article/details/106592598

版权

GRU

结构图

向前传播的公式

$\begin{array}{l} 注：图中用 h^{\prime} 表示 \tilde{h}_{t} \\ r_{t}=\sigma\left([h_{t-1}, x_{t}] \cdot W_{r}\right) \\ z_{t}=\sigma\left([h_{t-1}, x_{t}] \cdot W_{z}\right) \\ \tilde{h}_{t}=\tanh \left(\left[r_{t} * h_{t-1}, x_{t}\right] \cdot W_{\tilde{h}}\right) \\ h_{t}=\left(1-z_{t}\right) * h_{t-1}+z_{t} * \tilde{h}_{t} \\ y_{t}=\sigma\left(h_{t} \cdot W_{o} \right) \end{array}$

[ ]是将方括号内的矩阵拼接相连，如：[2, 3] 与 [11] 拼接成 [2, 3, 11]
*表示矩阵的阿达马乘积，即元素对位相乘
$\sigma$ 是sigmoid函数，将数据缩放到（0 ，1）；tanh是双正切函数，将数据缩放到（-1 ， 1）
reset重置门：决定丢弃前一时刻的状态信息的程度，r 越小丢弃越多，r范围（0，1）
update更新门：在这，（1-z）构成遗忘门（参考LSTM）选择性遗忘前一时刻状态信息 $h_{t-1}$ ，选择性记忆当前隐藏状态信息 $h^{\prime}$ ，最后得到 ${h}_{t}$ 。 有些博客是反过来的 $h_{t}=z_{t} * h_{t-1}+(1-z_{t}) * \tilde{h}_{t}$ 即把z当作遗忘门，问题不大，其实道理都差不多，懂我意思吧~

如果有错，非常欢迎指出错误，我会积极接受人民群众的批评，未完待续~

允许转载，请附上原创链接，谢谢~

参考链接
https://zhuanlan.zhihu.com/p/32481747

dodo可大魔王

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
应该能看懂的GRU结构

GRU结构图向前传播的公式注：图中用h′表示h~trt=σ([ht−1,xt]⋅Wr)zt=σ([ht−1,xt]⋅Wz)h~t=tanh⁡([rt∗ht−1,xt]⋅Wh~)ht=(1−zt)∗ht−1+zt∗h~tyt=σ(ht⋅Wo)\begin{array}{l}注：图中用 h^{\prime} 表示 \tilde{h}_{t} \\r_{t}=\sigma\left([h_{t-1}, x_{t}] \cdot W_{r}\right) \\z_{t}=\sigma\left([h_
复制链接

扫一扫