深度学习第六章 RNN循环神经网络

最新推荐文章于 2024-06-26 19:42:33 发布

桃子Anne

最新推荐文章于 2024-06-26 19:42:33 发布

阅读量514

点赞数

分类专栏：深度学习文章标签：深度学习循环神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tao8783/article/details/107217065

版权

本文介绍了RNN循环神经网络的基本概念和结构，强调了其在处理序列数据时的特点。接着深入探讨了RNN的问题——长期依赖，由此引出LSTM（长短记忆网络）的原理，包括其遗忘门、输入门和输出门的设计，以解决RNN无法有效处理长序列信息的问题。

摘要由CSDN通过智能技术生成

深度学习入门视频-唐宇迪（笔记加自我整理）

深度学习第六章 RNN循环神经网络

1.RNN

RNN循环神经网络，重点在循环两字上面。和典型神经网络一样，也是由输入层、隐含层、输出层构成。和大部分神经往不同，RNN输入的是序列。对比Word2vec的CBOW，虽然输入的都是带有前后关系的样本，不同的是Word2Vec的CBOW输入的上下文单词数据，需要预测中心位置单词的是正确单词的概率，像选词填句。而RNN输入的是一个完整的序列，不需要预测中间结果，比如可以是输入一段话，预测这一段话表达的情感是消极还是积极的，也可以预测下一个单词是什么（RNN最后位置 vs CBOW中间位置），而且RNN是没有词向量作为副产品产出，训练完成得到的只有一个模型（权重参数）。

下面是一个比较经典的RNN结构，左边是未展开样子，输入为Xt，A表示隐含层，ht表示经由第t词计算得到的中间结构，右图是展开的样子，两者表达的意义是一样的。

可以用学习的过程来解释RNN过程，比如学习深度学习这课程，第一天学习，第二天学习，第三天学习，每一天学习的效果是由历史的积累和当前学习到的内容共同决定的，越到后面学习的效果越是叠加的。（人的大脑容量也是有限的，所以会出现某些知识点被记住，某些知识点被忘记，而LSTM模型和大脑记忆的不同时，LSTM是自己选择性遗忘和记忆，大脑有点不受控。）

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。