【机器学习核心总结】什么是长短时记忆网络(LSTM)

长短时记忆网络(LSTM)为解决RNN的短期记忆问题而设计,通过遗忘门、输入门和输出门实现信息的选择性保留。LSTM能够平衡短期和长期依赖,其变体包括GRU,具有简洁的结构和高效的计算性能。
摘要由CSDN通过智能技术生成

什么是长短时记忆网络(LSTM)

RNN有一定的记忆能力,但不幸的是它只能保留短期记忆,在各类任务上表现并不好,那该怎么办?

人们将目光投向了自己,人类的记忆是有取舍的,我们不会记住每时每刻发生的所有事,会有选择的留下重要的,丢掉不重要的。

参考这种记忆机制,人们改造了RNN中使用的“小盒子”,并找到了“门”这种机制,门是用来决定信息如何保留的小开关,它的数值在0-1之间,1是完全保留,0是完全舍弃。

新的小盒子上有三个门

  1. 其中遗忘门决定了小盒子里要保留多少原有信息,也就是丢掉哪些不重要记忆
  2. 输入门决定了当前网络信息有多少要被保存到小盒子里,也就是记住哪些新东西
  3. 输出门决定了多大程度的输出小盒子中的信息

经过改造的小盒子,既能通过输入门对当前网络状态有所了解,又能利用遗忘门留下过往的重要信息,这就是LSTM-长短时记忆模型

请添加图片描述

通过改变小盒子的结构,LSTM还有很多变体,如MGU、SRU。

不过最受欢迎的还是门控循环单元

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

coder ᅟᅠ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值