原理笔记 - 循环神经网络（RNN）

艳九九

已于 2023-12-26 12:41:08 修改

阅读量217

点赞数 5

文章标签： rnn 人工智能 python 机器学习深度学习神经网络

于 2023-12-26 12:40:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44785860/article/details/135218902

版权

目录

1. 呈上启下的前言

2. 序列模型

3. RNN循环网络

3.1 RNN识别人名

Step 1 :转化字典

Step 2 :one-hot 向量处理

Step3: 带入模型

3.2 基本的RNN结构

3.3 RNN存在的问题

4. 长短期记忆网络（LSTM）

4.1引入记忆细胞

4.2 LSTM 单元核心结构

5. 双向循环神经网络（BRNN）

6. 深层循环神经网络（DRNN）

1. 呈上启下的前言

在前几篇笔记中，我们讲了CNN卷积神经网络，我们可以把CNN总结为：

MLP + 图像卷积运算 = CNN

接下来我们要介绍另一种神经网络，RNN循环神经网络，提前总结为：

MLP + 神经元之间的递归运算 = RNN

为什么会有序列模型的出现？

在传统的机器学习模型中，数据的顺序不会影响结果。但在一些实际生活中，数据本身的顺序就传达了不同的信息，比如 ‘吃饭没’ 和 ‘没吃饭’ ，这就引出了序列模型（Sequence model）的应用。

2. 序列模型

序列模型的定义为，输入或输出中包含有序数据的模型，即序列中包含信息的模型。其与传统机器学习最大的区别在于：

1. 输入或输出元素有顺序关系，顺序会影响结果。

2. 输入输出长短不固定

序列模型的应用场景：

声音转文字
人名识别
自然语言情感分析
DNA序列分析
机器翻译
行为预测
股票预测
等。。。

3. RNN循环网络

通过序列模型的思想去解决问题，有一个非常厉害的模型，就是RNN循环神经网络。RNN神经网络的机构也非常好理解，就是在MLP模型的基础上加上了神经元的递归，说白了就是前部序列的重要信息会再次作为一个神经元输入后面序列。

3.1 RNN识别人名

对应代码：《代码实战 – 循环神经网络（RNN）》

自然语言处理是RNN的重要应用场景，所以我们来看一下他是如何处理字符串。

Step 1 :转化字典

Step 2 :one-hot 向量处理

Step3: 带入模型

现在，有x有y了，就可以进行正向传播算法了，目标为最小化总损失，这就是整个RNN模型识别人名的运用了，在有了输入与输出后算法与前面讲到的MLP和CNN逻辑是一样的。

3.2 基本的RNN结构

1. 一对一

特点：多输入多输出，且输入输出样本数相同，即一个输入样本对应一个输出结果

应用：特定信息查找，如上面识别人名的案例。

2. 多对一

特点：多输入单输出

应用：情感识别

举例：I am very happy.

输出：positive

3. 一对多

特点：单输入，多输出

应用：序列数据生成器（图片字幕，音乐生成，文章生成）

举例：帮我写一篇500字的作文

输出：（此处省略500字）

4. 多对多

特点：多输入，多输出，但输入输出样本数可能不相同

应用：机器翻译

举例：Do you want to have dinner with me?

输出：你想和我一起吃晚饭吗？

3.3 RNN存在的问题

两大问题：

1. 前部信息在传递到后面之后，信息权重下降，可能导致重要信息丢失

2. 对RNN进行反向传播算法求解时，梯度会消失，就没办法找到一个很好的解

4. 长短期记忆网络（LSTM）

4.1引入记忆细胞

为了解决上面我们提到的问题，我们引入长短期记忆网络（long short term memory）。先对比下单元区别：

a实现了序列信息传递，记忆细胞c保证重要信息不易丢失，从而提高预测准确性。

4.2 LSTM 单元核心结构

4.2 LSTM结构

现在即使有很多层，也可以保证前部重要信息在后面预测中保留
减少了普通RNN的求解过程中的梯度消失问题

5. 双向循环神经网络（BRNN）

核心思想：后续序列信息也会用于前部信息的预测

6. 深层循环神经网络（DRNN）

核心思想：把单层RNN叠起来或结合MLP结构一起使用，用于更难提取的复杂信息

关注

5
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
原理笔记 - 循环神经网络（RNN）

在前几篇笔记中，我们讲了CNN卷积神经网络，我们可以把CNN总结为：MLP + 图像卷积运算 = CNN。接下来我们要介绍另一种神经网络，RNN循环神经网络，提前总结为：MLP + 神经元之间的递归运算 = RNN
复制链接

扫一扫

艳九九 CSDN认证博客专家 CSDN认证企业博客

码龄5年

16: 原创

140万+: 周排名

11万+: 总排名

1万+: 访问

: 等级

383: 积分

186: 粉丝

223: 获赞

9: 评论

114: 收藏

私信

关注

热门文章

最新评论

原理笔记 - AdaBoost
CSDN-Ada助手: 恭喜您撰写了这篇关于AdaBoost原理的博客！能够深入理解并分享这一复杂的算法原理，实属不易。对于下一步的创作建议，我建议您可以考虑加入一些实际案例或者代码实现，这样读者更容易理解和应用。期待您的下一篇作品！祝您创作顺利！
原理笔记 - CatBoost
CSDN-Ada助手: 恭喜您发布了第15篇博客！阅读了您的原理笔记 - CatBoost，觉得内容非常有深度，对CatBoost的原理解析十分透彻。希望您能继续保持这样的创作热情和专注，为读者带来更多有价值的内容。建议您在以后的创作中，可以尝试加入一些实际案例分析或者应用场景的探讨，让读者更好地理解和应用所学知识。期待您的下一篇作品！祝您创作顺利！
原理笔记 - XGBoost算法
CSDN-Ada助手: 恭喜你写了第13篇博客！看到你分享关于XGBoost算法的原理笔记，我觉得你对这个算法有很深的理解。希望你能继续保持创作的热情，不断分享自己的学习心得和经验。或许下一步可以考虑写一些实际应用案例，让读者更直观地了解XGBoost算法在实际项目中的应用。希望你能继续努力，不断进步！
原理笔记 - 决策树
CSDN-Ada助手: 恭喜你写了第10篇博客，标题为“原理笔记 - 决策树”！你对决策树的理解和分享让读者受益匪浅。希望你可以继续保持创作的热情，探索更多有趣的主题，并结合实践经验分享给大家。也许下一步可以考虑深入研究一些新兴的机器学习算法或者数据挖掘技术，相信你会有更多有价值的见解和经验分享。期待你的下一篇博客！
代码实战 - 深度学习之混合模型
CSDN-Ada助手: 恭喜您写了这么深入的一篇博客，对深度学习混合模型进行了实战的探讨，让读者受益匪浅。希望您能继续坚持创作，不断分享您的学习心得和实战经验。下一步建议可以考虑结合具体的案例，深入分析混合模型在实际项目中的应用，以及优化方法的探讨。期待您更多的精彩分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。