循环神经网络（Recurrent Neural Network, RNN）

最新推荐文章于 2021-10-06 23:29:48 发布

alwaysyxl

最新推荐文章于 2021-10-06 23:29:48 发布

阅读量230

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alwaysyxl/article/details/83217349

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

总结自吴恩达老师的网易深度学习工程师微专业

1. 前向传播

在这里插入图片描述
$a^{t}=g^{(a)}(W_{aa}a^{<t-1>}+W_{ax}x^{<t>}+b_a)$
$\hat y^{<t>}=g^{(y)}(W_{ya}a^{<t>}+b_y)$
or, 简化版
$a^{t}=g^{(a)}(W_a[a^{<t-1>}, x^{<t>}]+b_a)$
$\hat y^{<t>}=g^{(y)}(W_ya^{<t>}+b_y)$

Note

一般而言，初始激活向量为： $a^{<0>}=\vec0$
通常， $g^{(a)}$ 选择 $t a n h$ 函数（ $t a n h$ 函数梯度消失的问题会用其他方式解决），有时也会选用 $r e l u$ 函数。
$\hat y^{<t>}=g^{(y)}(W_{ya}a^{<t>}+b_y)$ 如果是二分类问题，使用 $s i g m o i d$ 函数，如果是多分类问题，可以使用 $s o f t m a x$ 函数。

2. 损失函数

为了进行反向传播计算，使用梯度下降等方法来更新RNN的参数，我们需要定义一个损失函数，如下：
$L(\hat y,y)=\sum^{T_y}_{t=1}L^{<t>}(\hat y^{<t>},y^{<t>})=\sum^{T_y}_{t=1}-(y^{<t>}log(\hat y^{<t>})+(1-y^{<t>})log(1-\hat y^{<t>}))$

3. BPTT

RNN的反向传播将在后续部分有专门的介绍。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
循环神经网络（Recurrent Neural Network, RNN）

总结自吴恩达老师的网易深度学习工程师微专业1. 前向传播at=g(a)(Waaa&amp;lt;t−1&amp;gt;+Waxx&amp;lt;t&amp;gt;+ba)a^{t}=g^{(a)}(W_{aa}a^{&amp;lt;t-1&amp;gt;}+W_{ax}x^{&amp;lt;t&amp;gt;}+b_a)at=g(a)(Waaa&lt;t−1&gt;+Waxx&lt;...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。