RNN和LSTM

最新推荐文章于 2024-08-12 01:32:42 发布

Daniel_mc

最新推荐文章于 2024-08-12 01:32:42 发布

阅读量901

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_32693445/article/details/81939280

版权

RNN是一种允许信息持续存在的循环神经网络，尤其在处理时序数据如语音识别、语言建模等方面取得显著效果。然而，RNN在处理长期依赖问题时表现不佳。LSTM作为RNN的变体，通过其独特的门控机制解决了这一问题，能有效学习和存储长期依赖性信息。LSTM包含遗忘门、输入门和输出门，分别用于控制细胞状态的更新、存储和输出。

摘要由CSDN通过智能技术生成

RNN（递归神经网络）

当我们阅读这篇文章的时候，并不是每次都从头开始思考每个词每句话的意思，我们会自然而然地根据之前的语境（也即前面的词）去理解每个词、每句话。这就是说我们的想法是有持久性的。
传统的神经网络对于事件的时序性似乎没有什么好办法，比如现在要对电影中每个时间点发生的事件进行分类，传统的CNN并不会利用对电影先前时间的推理来得到后者的结果。
RNN解决了这个问题。它是具有循环的网络，允许信息的持续存在。
这里写图片描述
这张图不太好理解，可以把它展开来看：

过去几年中，RNN应有于好多问题都取得了令人难以置信的成功：语音识别、语言建模、翻译、图像字幕等等。这个列表还在继续。而这些成功的关键在于使用LSTM，这是一种RNN的变体，对于许多人物而言，LSTM的效果要比标准版的RNN好得多。几乎所有基于RNN取得的令人兴奋的结果都是用LSTM和它的微改实现的。
-