具有记忆能力的 RNN

最新推荐文章于 2022-11-21 21:06:30 发布

Alice熹爱学习

最新推荐文章于 2022-11-21 21:06:30 发布

阅读量648

点赞数

分类专栏：自然语言处理面试基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aliceyangxi1987/article/details/108728589

版权

在导读部分我们提到了序列数据，它的一个重要特性是具有顺序，而 RNN 的记忆性使它可以处理序列数据。现实世界有很多问题的研究对象都是序列数据，尤其是自然语言处理中几乎所有问题都和序列数据相关。段落是句子的序列，句子是单词的序列，单词是字母的序列，音频视频也是由帧组成的序列。在所有这些应用中，序列数据的顺序是很重要的，顺序发生了变化，含义也会发生变化。简单的前馈神经网络处理这类问题是非常受限制...

摘要由CSDN通过智能技术生成

在导读部分我们提到了序列数据，它的一个重要特性是具有顺序，而 RNN 的记忆性使它可以处理序列数据。

现实世界有很多问题的研究对象都是序列数据，尤其是自然语言处理中几乎所有问题都和序列数据相关。段落是句子的序列，句子是单词的序列，单词是字母的序列，音频视频也是由帧组成的序列。

在所有这些应用中，序列数据的顺序是很重要的，顺序发生了变化，含义也会发生变化。

简单的前馈神经网络处理这类问题是非常受限制的，因为它们假设输入数据是独立的，而这样显然会丢失掉数据的很多模式。

下面让我们具体看看 RNN 的结构和计算原理，来看它是如何具有处理序列数据所需的记忆能力的。

本文将讲述以下内容：

RNN 模型
RNN 的前向计算
- 为什么说 RNN 具有记忆功能？
损失函数
反向传播：BPTT
- RNN 存在梯度消失／爆炸问题的原因是什么？
- 梯度消失／爆炸的解决方案有什么？
应用举例:
- 用基本的 RNN 识别垃圾邮件

1. RNN 模型

RNN 译为循环神经网络，即这种网络的神经元之间形成了一个有向循环。

那首先来看一下基本 RNN 的结构：

FOvRsK

我们可以以命名实体识别问题为例来看结构图，即识别一句话中的人名地名等实体名词。

在时刻 t，输入为 $x^{<t

了解本专栏

Alice熹爱学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
具有记忆能力的 RNN

在导读部分我们提到了序列数据，它的一个重要特性是具有顺序，而 RNN 的记忆性使它可以处理序列数据。现实世界有很多问题的研究对象都是序列数据，尤其是自然语言处理中几乎所有问题都和序列数据相关。段落是句子的序列，句子是单词的序列，单词是字母的序列，音频视频也是由帧组成的序列。在所有这些应用中，序列数据的顺序是很重要的，顺序发生了变化，含义也会发生变化。简单的前馈神经网络处理这类问题是非常受限制...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。