AI作业11-RNN

最新推荐文章于 2024-07-13 02:38:40 发布

姆给瓦拉

最新推荐文章于 2024-07-13 02:38:40 发布

阅读量123

点赞数 2

分类专栏： AI基础文章标签：人工智能 rnn 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51521471/article/details/130765062

版权

AI基础专栏收录该内容

12 篇文章 1 订阅

订阅专栏

一、前馈网络存在的问题

1.只能处理静态输入，无法考虑上下文信息；

2.对于高维输入，需要大量的训练数据来避免过拟合；

3.容易受到局部极小值的影响，导致训练过程不稳定；

4.无法处理序列数据，如文本和时间序列等。

二、序列数据

序列数据是常见的数据类型，前后数据通常具有关联性

三、循环神经网络（RNN）为什么能解决前馈网络中的问题

循环神经网络通过引入“记忆单元”（memory cell）来解决这些问题，每一次处理时序数据时，记忆单元都会接收前一次的处理结果和上一次的记忆状态作为输入，这样就能够记忆之前的信息，同时根据之前的信息来影响下一次的处理。另外，循环神经网络还可以有可变长度的输入和输出。这是因为记忆单元的状态是动态更新的，可以根据不同的输入长度进行扩展或者缩短。

四、卷积神经网络（CNN）与循环神经网络（RNN）的异同

异：

卷积神经网络通常用于计算机视觉中，可以用来识别和分类图像。CNN用于提取图像的空间特征，通过不断的卷积和池化操作实现特征提取和降维。

循环神经网络通常用于自然语言处理和语音识别中，可以用来处理时间序列数据。RNN的主要思想是把前面的信息传递到后面，这样网络就可以利用之前的信息做出预测，能够处理序列中每个时间步的数据。
同：

卷积神经网络和循环神经网络都是深度学习的重要框架。

五、沿时间反向传播算法（BPTT）

通过时间反向传播是一种用于训练循环神经网络的方法。它是反向传播算法的一种扩展，可以将误差从网络的输出层向后传播到网络的隐藏层和输入层，从而更新网络的权重。

BPTT方法可以追溯到1986年，由Rumelhart、Hinton和Williams提出。它是一种基于梯度下降的优化方法，通过反向传播计算每个时间步的误差，然后更新网络的权重。BPTT方法的优点是可以处理任意长度的序列数据，适用于语音识别、自然语言处理等任务。

六、序列到序列模型 seq2seq

seq2seq(sequence to sequence)模型是NLP中的一个经典模型，基于RNN网络模型构建，用途非常广泛：语言翻译，人机对话，问答系统等。

Seq2Seq，就如字面意思，输入一个序列，输出另一个序列，比如在机器翻译中，输入英文，输出中文。这种结构最重要的地方在于输入序列和输出序列的长度是可变的。而Seq2Seq模型也经常在输出的长度不确定时采用。

七、梯度消失、梯度爆炸

1. 梯度消失(gradient vanishing problem)
我们知道神经网络在进行反向传播(BP)的时候会对参数W进行更新，梯度消失就是靠后面网络层(如layer3)能够正常的得到一个合理的偏导数，但是靠近输入层的网络层，计算的到的偏导数近乎零，W几乎无法得到更新。

2. 梯度爆炸(gradient exploding problem)
梯度爆炸的意思是，靠近输入层的网络层，计算的到的偏导数极其大，更新后W变成一个很大的数(爆炸)。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
AI作业11-RNN

循环神经网络通过引入“记忆单元”（memory cell）来解决这些问题，每一次处理时序数据时，记忆单元都会接收前一次的处理结果和上一次的记忆状态作为输入，这样就能够记忆之前的信息，同时根据之前的信息来影响下一次的处理。这是因为记忆单元的状态是动态更新的，可以根据不同的输入长度进行扩展或者缩短。我们知道神经网络在进行反向传播(BP)的时候会对参数W进行更新，梯度消失就是靠后面网络层(如layer3)能够正常的得到一个合理的偏导数，但是靠近输入层的网络层，计算的到的偏导数近乎零，W几乎无法得到更新。
复制链接

扫一扫

专栏目录

姆给瓦拉 CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

130万+: 周排名

198万+: 总排名

942: 访问

: 等级

133: 积分

31: 粉丝

12: 获赞

5: 评论

0: 收藏

私信

关注

热门文章

分类专栏

AI基础 12篇

最新评论

AI作业9-卷积3-XO识别
CSDN-Ada助手: 恭喜您完成了第9篇博客，这篇关于AI作业的博客内容非常有趣。您的博客内容很实用，让我受益匪浅。我希望您能够继续创作，分享更多的知识和经验。下一步的创作建议是，您可以尝试写一些更加深入的技术文章，让读者更好地了解AI和卷积的原理。谢谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
AI作业10-经典卷积网络
CSDN-Ada助手: 恭喜您第10篇博客的成功发布，内容涵盖了经典卷积网络，这是一个非常有价值的话题。在接下来的创作中，建议您可以考虑更深入地探讨卷积网络在实际应用中的优化以及其它机器学习算法的比较分析等方面，让读者更全面地了解这个领域的发展。期待您更多优质的内容分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
AI作业1-ML基础
CSDN-Ada助手: 恭喜您的文章入围每天最佳新人「2023-03-21」榜单, 排名「48」, 一定要再接再厉哦, 创作更多高质量博客, 争取拿到更好成绩, 全部的排名请看: https://bbs.csdn.net/topics/614165570 更多创作活动请看: 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket
AI作业1-ML基础
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AI作业1-ML基础
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614165570。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。