[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型

最新推荐文章于 2022-09-05 12:17:38 发布

御前上等

最新推荐文章于 2022-09-05 12:17:38 发布

阅读量278

点赞数

分类专栏： RNN LSTM 笔记 AI 文章标签： LSTM RNN 笔记 DL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43991786/article/details/88542665

版权

笔记同时被 3 个专栏收录

13 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型

文章目录

[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型

序列模型能够运用的领域：

100

one-hot编码：

要使用的数据为1矩阵其余元素为0的单列矩阵（向量）

遇到此表中不存在的单词时，在表尾新建一名为UKW(unknow word)的新元素

传统神经网络在处理序列数据上的问题：

101

RNN暴露出的问题：

如图，RNN在计算输出例如：y^(3) 时会吸收 a^(0) a^(1) a^(2)以及x(1) x(2)的经验，而无法吸收例如x(3)等来自后面学习到的经验；这会造成例如：图中最后两行所示无法识别Teddy是否为人名的问题（第一行为人名，第二行不是）；而BRNN（双向循环神经网络）就能解决这一问题

注：一般a^(0)为输入的零向量

102

前向传播的推导：

103

104

RNN的反向传播：

105

其损失函数为Logistic的损失函数，也称交叉熵函数
缺点：wyby的值过大过小会产生梯度爆炸或梯度消失

RNN的一般类型：

123

one to many 音乐生成
many to one 情感分析
many to many 命名物体识别
many to many（长度不一样）机器翻译

RNN model解释：

122

每层输出用softmax来预测

RNN对新序列进行采样的过程：

121

RNN对新序列进行采样

梯度消失的原因：

120

RNN的反向传播会产生梯度消失或梯度爆炸问题
梯度消失可以靠梯度修剪（gradient clipping的方法避免
梯度修剪：观察某个向量如果它到达某一阈值—缩放梯度向量导致它不会太大

GRU:

GRU（门控循环单元）是LSTM网络的一种效果很好的变体，它较LSTM网络的结构更加简单，而且效果也很好，因此也是当前非常流形的一种网络。GRU既然是LSTM的变体，因此也是可以解决RNN网络中的长依赖问题。

GRU的推导：

110

完整的GRP：

111

GRU与LSTM的对比：

112

LSTM:

113

双向RNN（Bidirectional RNN）：

不仅可以获得之前的信息也能获取未来的信息

缺点：需要整段序列数据才能预测；如：语音识别，得等到一人说完整段话才能识别

114

框图

Deep RNNs:

115

框图

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型

[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型文章目录[笔记]|[DL]|[RNN]吴恩达深度学习10——序列模型序列模型能够运用的领域：one-hot编码：传统神经网络在处理序列数据上的问题：RNN暴露出的问题：前向传播的推导：RNN的反向传播：RNN的一般类型：RNN model解释：RNN对新序列进行采样的过程：梯度消失的原因：GRU:GRU的推导：完整的GRP：GRU与LS...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。