LSTM原理,一句话道出

lstm原理的理解

本博客介绍了我对于lsdm的一些理解。

第一步原理理解RNN与LSTM的区别

下面贴出我在网上(百度百科)找到的原理:

“LSTM区别于RNN的地方,主要就在于它在算法中加入了一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell。
一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用。
只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘。
说起来无非就是一进二出的工作原理,却可以在反复运算下解决神经网络中长期存在的大问题。
目前已经证明,LSTM是解决长序依赖问题的有效技术,并且这种技术的普适性非常高,导致带来的可能性变化非常多。
各研究者根据LSTM纷纷提出了自己的变量版本,这就让LSTM可以处理千变万化的垂直问题。”

lstm

长短时记忆网络(Long Short Term Memory Network, LSTM),是一种改进之后的循环神经网络,可以解决RNN无法处理长距离的依赖的问题,目前比较流行。
其实在之前我还是看了不少博客还是没有搞懂,于是今天下午,我一定要弄懂
下面是我看到的一篇不错的博客
传送门
下面是我的一些理解,首先要了解一下下我们滴RNN:
RNN是什么,在我的理解中,就是说有了一个记忆功能的神经网络,RNN就像是一个递归,就是在自己调用自己,我不知道这样说的是不是准确,但是我觉得是挺对的。
下面是大佬的一段话:
(我看过之后感觉讲的很好,就拿过来了)

通俗的说:RNN就是一个在时间上的循环,每次循环都会用到上一次的时间。
关于输出,虽然RNN每个时刻t都会有输出,但是最后时刻的输出实际上已经包含了之前所有时刻的信息,所以一般我们只保留最后一个时刻的输出就够了。

RNN有缺点,就是没有办法解决梯度消失的问题,这就要用到我们的lstm!

LSTM就是增加了一个遗忘得功能,选择你想要得数据保存,而不想要得删掉。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值