AI-LSTM

croyance77

已于 2024-03-29 19:45:38 修改

阅读量161

点赞数 1

文章标签：人工智能 lstm 深度学习

于 2023-05-28 09:04:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/croyance77/article/details/130909261

版权

LSTM

1、长短期记忆网络 LSTM（输入门、遗忘门、输出门）
2、LSTM如何克服梯度消失
3、门控循环单元神经网络 GRU（更新门、重置门）
- Ⅰ更新门（Update Gate）
- Ⅱ重置门（Reset Gate）

1、长短期记忆网络 LSTM（输入门、遗忘门、输出门）

长短期记忆网络（Long Short-Term Memory，LSTM）是一种循环神经网络（RNN）的变体，用于解决RNN中的梯度消失和梯度爆炸问题，以及更好地捕捉序列中的长期依赖关系。

Ⅰ输入门（Input Gate）

输入门控制着新的输入信息对记忆单元的影响。它通过对输入的加权选择来更新记忆单元的状态。输入门的作用是决定多少新信息应该进入记忆单元。

Ⅱ遗忘门（Forget Gate）

遗忘门决定了记忆单元中哪些信息应该被遗忘。它通过对之前的记忆状态进行加权选择来控制遗忘程度。遗忘门的作用是决定之前记忆中的哪些信息应该被保留。

Ⅲ输出门（Output Gate）

输出门决定了记忆单元中的信息应该输出到下一个时间步。它根据当前的输入和记忆单元的状态来生成输出。输出门的作用是控制哪些记忆状态应该被输出到网络的其他部分。

此外，LSTM的核心是记忆单元，用于存储和传递信息。它类似于一个内部状态，可以在不同时间步之间传递和修改。记忆单元具有一个激活值，表示当前时刻的记忆状态。

2、LSTM如何克服梯度消失

LSTM通过记忆单元和门控机制的设计，能够在一定程度上避免梯度消失问题。记忆单元允许信息在时间上流动，而门控机制（遗忘门、输入门和输出门）能够控制信息的更新和流动，从而更好地捕捉和处理序列中的长期依赖关系。这些机制使得LSTM能够有效地传播梯度，避免梯度在反向传播过程中消失，使得深层网络能够更好地学习和训练。

3、门控循环单元神经网络 GRU（更新门、重置门）

门控循环单元（Gated Recurrent Unit，GRU）是一种循环神经网络（RNN）的变体，与长短期记忆网络（LSTM）类似，也是为了解决梯度消失和梯度爆炸问题，以及更好地处理序列中的长期依赖关系。
GRU引入了两个门控机制：更新门（Update Gate）和重置门（Reset Gate）。这些门控机制允许网络选择性地更新和传递信息，从而提高了模型的表示能力和学习能力。

Ⅰ更新门（Update Gate）

更新门控制着前一个隐藏状态和当前输入之间的信息流。它决定了前一个隐藏状态应该如何与当前输入进行混合，以及前一个隐藏状态中多少信息应该被保留下来。通过更新门，GRU能够灵活地控制前一个隐藏状态中的信息更新程度。

Ⅱ重置门（Reset Gate）

重置门决定了前一个隐藏状态对当前输入的影响程度。它决定了前一个隐藏状态应该如何与当前输入进行组合，以及前一个隐藏状态中多少信息应该被重置。通过重置门，GRU能够灵活地调整前一个隐藏状态的权重。

此外，GRU通过使用更新门和重置门来计算当前隐藏状态（Current Hidden State）。当前隐藏状态是根据前一个隐藏状态、当前输入和门控信息来更新的。更新门决定了前一个隐藏状态和当前输入的混合程度，而重置门决定了前一个隐藏状态的重置程度。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
AI-LSTM

长短期记忆网络
复制链接

扫一扫

croyance77 CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

136万+: 周排名

94万+: 总排名

1783: 访问

: 等级

145: 积分

2: 粉丝

14: 获赞

5: 评论

1: 收藏

私信

关注

热门文章

最新评论

AI-经典卷积网络
CSDN-Ada助手: 非常棒的第10篇博客！恭喜您在AI领域的学习上取得了如此大的进展。对于经典卷积网络的深入研究，相信您已经有了更深入的认识和理解。希望您能够继续保持这样的学习热情和创作动力，不断探索AI领域的更多知识和技术。同时，建议您可以尝试拓展博客主题，涉及更多的AI应用场景和技术细节，让读者们能够更加全面地了解AI的发展和应用。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
AI-卷积3-XO识别
CSDN-Ada助手: 恭喜您完成了第9篇博客，标题看起来非常有趣！我非常期待阅读您的内容，并且想提供一个建议。既然您已经掌握了卷积3-XO识别，为什么不考虑将其应用于其他领域呢？也许使用这种技术来识别其他形状或模式会很有趣。无论如何，请继续保持创作并分享您的知识！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
AI-深度学习基础
croyance77: 对，应该是McCulloch—Pitts模型不过有看到Max—Pooling模型，而且也叫MP模型比较新，我就写了这个MP模型
AI-深度学习基础
HBU_David: MP模型不对，在本章不是这个意思
AI-无监督学习
CSDN-Ada助手: 恭喜您写出了第四篇博客，题目也很有内涵。无监督学习是一个非常重要的领域，希望您能够继续深入探索，为读者们带来更多有价值的内容。下一步的创作建议是可以结合实际案例进行分析，让读者更好地理解无监督学习的应用场景和方法。期待您的下一篇文章！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。