纯公式版RNN前向过程

最新推荐文章于 2023-07-12 14:27:04 发布

Albert2X

最新推荐文章于 2023-07-12 14:27:04 发布

阅读量173

点赞数

分类专栏：机器学习文章标签：深度学习

本文链接：https://blog.csdn.net/m0_50344530/article/details/108445797

版权

1 篇文章 0 订阅

订阅专栏

输入： $x_t$

循环层： $h_{t}=f\left(W_{x h} x_{t}+W_{h h} h_{t-1}+b_{h}\right)$

输出： $y_{t}=g\left(W_{\mathrm{o}} h_{t}+b_{\mathrm{o}}\right)$

三个门控信号：
$i_t=\sigma(W_{xi}x_t+W_{hi}h_{t-1}+b_i)$
$f_t=\sigma(W_{xf}x_t+W_{hf}h_{t-1}+b_f)$
$o_t=\sigma(W_{xo}x_t+W_{ho}h_{t-1}+b_o)$

cell状态：
$c_t=f_t\odot c_{t-1}+i_t\odot tanh(W_{xc}x_t+W_{hc}h_{t-1}+b_c)$

h层状态：
$h_t=o_t\odot tanh(c_t)$

两个门控信号：
$r_t = \sigma(W_{xr}x_t+W_{hr}h_{t-1} + b_r)$
$z_t = \sigma(W_{xz}x_t+W_{hz}h_{t-1} + b_z)$

中间状态 $n_t$ ：
$n_t=tanh(W_{xn}x_t + b_{xn}+r_t\odot(W_{hn}h_{t-1}+b_{hn}))$

h层状态：
$h_t=(1-z_t)\odot n_t+z_t \odot h_{t-1}$

相对于LSTM，GRU少了一个门，因此网络参数相对较少，但性能却和LSTM接近。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注