【22-23 春学期】AI作业12-LSTM

最新推荐文章于 2023-12-19 21:10:35 发布

凯尼拉

最新推荐文章于 2023-12-19 21:10:35 发布

阅读量54

点赞数 1

文章标签：人工智能 lstm 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39898476/article/details/131376093

版权

1.长短期记忆网络 LSTM（输入门、遗忘门、输出门）

长短期记忆网络（LSTM）是一种递归神经网络，用于解决序列建模问题。它包括一个重复模块，其中有三个门：输入门、遗忘门和输出门。

输入门的作用是决定是否将新信息传递到长期记忆单元中，其计算方式是通过输入层的当前输入和上一个时刻输出的状态向量以及门控权重向量来获得一个介于 0 和 1 的值，表示新信息的重要性。

遗忘门的作用是帮助判断哪些旧的信息应该被保留，哪些应该被遗忘。遗忘门也是通过门控权重向量来获得的，其值介于 0 和 1 之间，用于控制长期记忆单元中旧信息的保留程度。

输出门的作用是决定要从长期记忆单元中输出什么信息。输出门同样是通过门控权重向量计算得到的，其值介于 0 和 1 之间，用于控制长期记忆单元中信息的输出。

这种门控结构允许 LSTM 有效地控制信息的流动，确保关键信息不会被遗忘或淹没在噪声中。这使得 LSTM 在处理各种序列任务，如语音识别、自然语言处理和时间序列预测等领域展现出了强大的能力。

2.LSTM如何克服梯度消失

LSTM 克服了传统的 RNN 在长距离依赖建模时遇到的梯度消失问题。这是因为 LSTM 中的门控机制导致模型训练时的梯度流更为平稳。

在传统的 RNN 中，由于多个时间步的激活函数存在连乘的情况，当输入和权重的值很小或者发生反向传播时，会导致梯度逐渐趋近于 0，从而使得模型长期无法记住长期依赖的信息。LSTM 对此提出了一种门控结构，使得模型能够选择性地添加或删除信息，从而更有效地控制梯度流。

具体来说，LSTM 通过三个门控来控制长期依赖信息的流动：输入门（input gate）、遗忘门（forget gate）和输出门（output gate）。这些门控能够对信息的重要性进行动态调整，使得模型能够根据当前输入和之前的状态，有选择地丢弃或保留信息，从而更好地处理长期依赖性序列模型。

因此，在训练 LSTM 模型时，梯度流更平稳，避免了传统 RNN 模型中遇到的梯度消失问题，使得 LSTM 在具有长期依赖性的任务上表现良好。

3.门控循环单元神经网络 GRU（更新门、重置门）

门控循环单元神经网络（GRU）是一种近似于 LSTM 的递归神经网络结构，可用于解决序列建模问题。与 LSTM 不同，GRU 仅使用两个门：更新门和重置门。

更新门控制前后两个时间步之间的信息流，采用一个介于 0 和 1 之间的权重向量，用于控制当前状态向量和新输入的相对重要性。如果更新门接近 1，则新输入较重要；如果接近 0，则之前的状态较重要。

重置门用于决定多少之前的状态信息被保留，并作为新的候选状态。通过介于 0 和 1 之间的另一个权重向量控制。

与 LSTM 类似，GRU 也采用门控机制来帮助避免长期依赖问题和梯度消失问题。由于只有两个门，相对于 LSTM 更容易实现和更快速训练，因此在一些场景下它的性能也优于 LSTM。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【22-23 春学期】AI作业12-LSTM

1.长短期记忆网络 LSTM（输入门、遗忘门、输出门）2.LSTM如何克服梯度消失3.门控循环单元神经网络 GRU（更新门、重置门）
复制链接

扫一扫

凯尼拉 CSDN认证博客专家 CSDN认证企业博客

码龄7年

12: 原创

131万+: 周排名

112万+: 总排名

1255: 访问

: 等级

124: 积分

26: 粉丝

4: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

最新评论

AI作业4-无监督学习
CSDN-Ada助手: 恭喜您完成了第四篇博客！无监督学习是一个非常有趣的领域，也是机器学习中的重要一环。您的文章让我对这个领域有了更深入的了解。接下来，我建议您可以尝试探索一些无监督学习的实际应用场景，例如聚类、降维等，这样可以更好地帮助读者理解无监督学习的实际价值。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
AI-作业1
CSDN-Ada助手: 恭喜您的文章入围每天最佳新人「2023-03-16」榜单, 排名「31」, 一定要再接再厉哦, 创作更多高质量博客, 争取拿到更好成绩, 全部的排名请看: https://bbs.csdn.net/topics/614083590 更多创作活动请看: 原力计划S5 -- 寻找1000位优秀创作者: https://marketing.csdn.net/p/5352d383bcbb5346dc3430e9643d3255?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 「IT女神勋章」挑战赛--以创作之名致敬女性开发者: https://activity.csdn.net/creatActivity?id=10305&utm_source=csdn_ai_ada_redpacket
AI-作业1
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AI-作业1
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614083590。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。