RNN变体及其应用（详细）

最新推荐文章于 2024-06-26 19:42:33 发布

正在吃饭的派大星

最新推荐文章于 2024-06-26 19:42:33 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签： rnn 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47182486/article/details/119965795

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

ppt来自于李宏毅老师的视频

首先从带有记忆的网络开始：
在这里插入图片描述
前一步的隐藏层状态会写入记忆单元中

再次输入
可以发现相同输入。因为记忆单元存在，输出是不同的
rnn就是具有类似特点的网络，可以记忆之前输入的信息

同时rnn根据存储信息不同可以划分为不同的网络：
存储隐藏状态或者是输出
在这里插入图片描述
双向RNN：
将序列按照正反的双向顺序输入，根据两个的h获得输出y

优点是获得信息更广
在这里插入图片描述

LSTM

通过输入门决定是否将记忆写到记忆单元中
输出门决定是否将记忆单元中的值输出
遗忘门决定是否遗忘记忆单元的值

在这里插入图片描述
具体结构：
输入信号的激活函数都是sigmoid函数，取值在0-1之间，这样0就表示遗忘或者是拒绝，1就表示存储或通过，每次根据输入来更新c。

下面是一个方便理解LSTM记忆更新的例子：

信号量也是由输入变换得到的
在这里插入图片描述
实际上的网络，就是将神经元改成LSTM细胞，每次的输入先变换成向量Z，Z的维度和该层LSTM细胞数目相同，这样每个细胞处理向量中对应的一个维度元素
如下图所示，输入的X经过变换生成4个向量，作为LSTM的4个输入。
在这里插入图片描述
最终的输入包括了x h 和c

rnn训练方法

反向传播BPTT更新参数：
在这里插入图片描述
rnn训练时，可能会由于梯度难以调整学习率

可以使用LSTM进行纠正

RNN应用

多对一、一对多、多对多模型

情感分析：
在这里插入图片描述
语音辨识：

输入为语音信号，输出文字
在这里插入图片描述
机器翻译（seq2seq）：

RNN进阶：attention

控制读取和修改memory
在这里插入图片描述

正在吃饭的派大星

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
RNN变体及其应用（详细）

ppt来自于李宏毅老师的视频首先从带有记忆的网络开始：前一步的隐藏层状态会写入记忆单元中再次输入可以发现相同输入。因为记忆单元存在，输出是不同的rnn就是具有类似特点的网络，可以记忆之前输入的信息同时rnn根据存储信息不同可以划分为不同的网络：存储隐藏状态或者是输出双向RNN：将序列按照正反的双向顺序输入，根据两个的h获得输出y优点是获得信息更广LSTM通过输入门决定是否将记忆写到记忆单元中输出门决定是否将记忆单元中的值输出遗忘门决定是否遗忘记忆单元的值具体结构：输
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。