LSTM

飞鱼在这

于 2020-10-12 10:43:16 发布

阅读量84

点赞数

分类专栏：神经网络文章标签： lstm

原文链接：https://blog.csdn.net/juanjuan1314/article/details/52020607

版权

神经网络专栏收录该内容

3 篇文章 0 订阅

订阅专栏

LSTM

- 参考文章
- RNNs

参考文章

1.LSTM论文翻译-《Understanding LSTM Networks》
链接：

https://blog.csdn.net/juanjuan1314/article/details/52020607

RNNs

RNNS
长序依赖问题
RNN被选择的一个重要原因是它可以连接前面的信息为当前节点所用，就像视频前面的帧可以输入到当前环节来预测或者理解当前帧。如果RNN能真正做到这样，那它的确非常有用了，但是它真的能吗？实际上，这要视情况而定。
有时，我们只需要就近的一些信息就可以完成当前任务。例如，一个语言模型想要根据前面的词预测最后一个词，如要预测“the clouds are in the sky.”的最后一个词，我们不需要更多的上下文语境就能知道最后一个词是sky。在这个例子中，要用到的语境很简单，RNN可以很好的里面句子前面的词信息得到正确的答案。

但是，也有很多句子需要更多语境，如“I grew up in France. … I speak fluent French.”从临近的语境中可以知道，最后一个词应该是一种语言，但是要知道是哪种语言，必须要前面的“France”，要再往前推。需要的信息和当前点可能隔很远。
不幸的是，随着距离的增加，RNN并不能学习到有用的信息。

理论上，RNNs完全可以掌控“长句依赖”，我们可以人为的选择好的参数嘛。但实践证明，RNN基本不可能学习很长的句子。Hochreiter和Begnio对此有很深的研究，并且找到了根本原因。
而幸运的是，这个问题LSTM不会有。
后续见link

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。