[DeeplearningAI笔记]序列模型1.3-1.4循环神经网络原理与反向传播公式

最新推荐文章于 2021-06-17 23:38:37 发布

武科大许志伟

最新推荐文章于 2021-06-17 23:38:37 发布

阅读量345

点赞数

分类专栏：深度学习 DeeplearningAI Deeplearning with Tensorflow 文章标签： DeeplearningAI 循环神经网络原理 RNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013555719/article/details/81874160

版权

深度学习同时被 3 个专栏收录

91 篇文章 2 订阅

订阅专栏

Deeplearning with Tensorflow

82 篇文章 12 订阅

订阅专栏

54 篇文章 1 订阅

订阅专栏

5.1循环序列模型

觉得有用的话,欢迎一起讨论相互学习~

吴恩达老师课程原地址

1.3循环神经网络模型

为什么不使用标准的神经网络

假如将九个单词组成的序列作为输入，通过普通的神经网网络输出输出序列，
1. 在不同的例子中输入数据和输出数据具有不同的长度，即每个数据不会有一样的长度
- 也许每个语句都有最大长度，能够通过Padding 的方式填充数据，但总体来说不是一个好的表达方式。
1. 不共享从文本的不同位置上学到的特征
- 例如普通神经网络可以学习到Harry这个单词出现在 $x^{<1>}$ 的位置，但是如果Harry这个单词出现在 $x^{<4>}$ 的位置，普通的神经网络不能识别的出来。
1. 输入量巨大，如果词典中最大的单词量是1W的话，则单词的one-hot表示向量将是一个1W维的数据。而一个训练语句中的单词数为 $T_{x}$ ,则输入数据的维度为 $T_{x} * 1W$ 此数据维度是十分巨大的。

循环神经网络模型

在这里插入图片描述

$a^{<0>}=\vec{0}$
$a^{<1>}=g(W_{aa}a^{<0>}+W_{ax}X^{<1>}+b_{a})$
$/ / g 表示非线性激活函数 (T a n h / R e L U)$
$\hat{y}^{<1>}=g(W_{ya}a^{<1>}+b_{y})$
$/ / g 表示非线性激活函数, 但是不一定要与上面的 g 相同 (S i g m o i d)$
$a^{<T_{x}>}=g(W_{aa}a^{<T_{x}-1>}+W_{ax}X^{<T_{x}>}+b_{a})$
$\hat{y}^{<T_{x}>}=g(W_{ya}a^{<T_{x}>}+b_{y})$

简化循环神经网络数学公式

将 $W_{aa}和W_{ax}合并成一个大的矩阵W_{a}，将a^{<t-1>}和X^{<t>}合并成[a^{<t-1>},X^{<t>}]$
具体如下图所示:

1.4通过时间的反向传播Backpropagation through time

武科大许志伟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

武科大许志伟

CSDN认证博客专家 CSDN认证企业博客

码龄11年

人工智能领域优质创作者

394: 原创

4547: 周排名

184万+: 总排名

175万+: 访问

: 等级

1万+: 积分

2万+: 粉丝

1094: 获赞

428: 评论

4554: 收藏

私信

关注

热门文章

分类专栏

最新评论

模拟二进制交叉算子详解
无限坍缩: 博主你好，在反解出子代那步，去绝对值，假设c1>c2，相应地，有p1<p2，根据扩散因子方程可得：c1 - c2 = beta * （p2 - p1），解出最后结果是c1= 1/2（p1+p2）+ beta/2 *（p2-p1）；c2= 1/2（p1+p2）- beta/2 *（p2-p1）。如果假设c1<c2，推出结果也类似，beta都是在分子上面
论文研读-多目标差分进化研究及应用-1 Review
偷偷拔网线: 我觉得那个地方应该没问题，如果cr也是随机的话就是两个随机数进行比较，若二者都服从0，1的均匀分布那么其效果就相当于是cr等于0.5，相当于是在原来情况下参数设定为一特定值的情况，是原来的子情况，而有cr则可以对其差分的概率进行不同的限制
论文研读-多目标多任务优化MOMFEA-II
DazzleQ: 请问MTO官网怎么进不去了
matlab学习笔记8 基本绘图命令-LineSpec线条设定
梦里呜咽的小河: 请问博主，为啥我在matlab里面输入help LineSpec显示找不到
Origin 三种方法在图片中添加水平辅助线
站在井底憧憬星空: 写写，有用，特别是是对个方法，

大家在看

基于指纹和六角键盘的门锁系统 122

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。