RNN 网络简介

最新推荐文章于 2024-06-16 12:59:01 发布

bohu83

最新推荐文章于 2024-06-16 12:59:01 发布

阅读量1.5k

点赞数

分类专栏： python 文章标签： rnn 网络深度学习 LSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bohu83/article/details/122793941

版权

python 专栏收录该内容

40 篇文章 3 订阅

订阅专栏

概述

从本节开始学习RNN相关内容。

神经网络可以当做是能够拟合任意函数的黑盒子，将神经网络模型训练好之后，对于input 输入x ，经过隐层后，输出层会得到y. 为啥还需要RNN网络呢？

神经网络都只能单独的取处理一个个的输入，前一个输入和后一个输入是完全没有关系的。但是，某些任务需要能够更好的处理序列的信息，即前面的输入和后面的输入是有关系的。

序列：我们可以理解不同的时刻t1,t2,...tn

比如当我们在理解一句话意思时，孤立的理解这句话的每个词是不够的，我们需要处理这些词连接起来的整个序列；

RNN结构

这是个抽象的图，右侧如果去到隐层自己的链接就变成了最普通的全连接神经网络。圈的含义：循环神经网络的隐藏层的值不仅仅取决于当前这次的输入，还取决于上一次隐藏层的值。

通过这个图，就容易看出上一时刻的隐藏层是如何影响当前时刻的隐藏层的。 $h_0$ ,... $h_{t-1}$ 都是中间结果，可以舍去，只需要最终的 $h_t$ .

LSTM

Long short-term memory，翻译就是长短期记忆，是RNN的一种，比普通RNN好。

为什么LSTM比普通RNN效果好？

展开就是梯度消失和爆炸的问题了，这里简单理解：如果一个句子很长，到句子末尾时，它将记不住这个句子的开头的内容详细内容（或者太长了以至于开头的内容对于最后没啥作用）

LSTM通过它的“门控装置”有效的缓解了这个问题，

公式没有展开讲，先简单整体理解：LSTM 有3个门，先经过输入门，看是否有信息输入，再判断遗忘门是否选择遗忘隐层里的信息，最后再经过输出门，判断是否将这一时刻的信息进行输出。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
RNN 网络简介

概述从本节开始学习RNN相关内容。神经网络可以当做是能够拟合任意函数的黑盒子，将神经网络模型训练好之后，对于input 输入x ，经过隐层后，输出层会得到y. 为啥还需要RNN网络呢？神经网络都只能单独的取处理一个个的输入，前一个输入和后一个输入是完全没有关系的。但是，某些任务需要能够更好的处理序列的信息，即前面的输入和后面的输入是有关系的。序列：我们可以理解不同的时刻t1,t2,...tn比如当我们在理解一句话意思时，孤立的理解这句话的每个词是不够的，我们需要处理这些词连接起来的整
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。