rnn神经网络模型_循环神经网络——反对称RNN模型

最新推荐文章于 2024-05-10 11:51:49 发布

weixin_39936134

最新推荐文章于 2024-05-10 11:51:49 发布

阅读量344

点赞数

文章标签： rnn神经网络模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39936134/article/details/111611867

版权

本文深入探讨了循环神经网络RNN及其问题，如梯度消失，提出了一种新的改进模型——反对称RNN。通过常微分方程的视角，文章阐述了如何利用反对称矩阵来增强RNN的稳定性和长期记忆能力，同时对比了LSTM的性能。实验证明，反对称RNN在记忆任务和CIFAR-10分类中表现出色，有效解决了传统RNN的局限性。

摘要由CSDN通过智能技术生成

本文主要介绍的是循环神经网络RNN及其研究进展，其中的主要内容来自于一篇2019年的ICLR论文，论文原文如下

AntisymmetricRNN: A Dynamical System View on Recurrent Neural Networksarxiv.org

一、RNN与LSTM

在机器学习领域中，循环神经网络（RNN）可以说是一块相当重要的组成部分了，由于它能够在处理新数据的时候将之前的数据也考虑进来，所以RNN在序列数据的建模中有着广泛的应用，例如机器翻译任务，我们在翻译一个单词时，如果能将之前已经翻译输入的单词信息也考虑进去的话，那么翻译的肯定会更加准确。为了达到这样目的，RNN采用了如下图所示的结构，其计算过程如下式所示，其中U、W和V都是权重参数。

循环神经网络

可以看出，对于RNN，在计算隐层值

时，输入的不仅有样本数据

，还有RNN在之前的计算出来的隐层值

，从而将之前的信息也考虑了进来，这就是RNN的原理。

但是RNN也存在着一些问题，虽然它能够用于对序列数据建模，但是当序列较长的时候，它就会出现梯度消失和梯度爆炸的问题，而这样就使得它在实际应用中收到了很大的限制。为了解决这个问题，LSTM应运而生，它是RNN的一个变种，下面是原始RNN和LSTM的结构对比。

RNN与LSTM

可以看出，LSTM比原始的RNN多了一个传递状态

。在LSTM中，传递状态

一般改变得很慢，通常是上一个状态

加上一些数值；

则往往变化很大，这也是模型叫做LSTM（Long short-term memory）的原因。

下面是LSTM的内部结构，首先类似于原始RNN，将输入的

和之前的状态

拼接起来一起作为输入，不过LSTM不是直接计算

，而是先计算得到四个状态：

，其中的

是用来作为门控状态，左图中的

代表sigmoid激活函数。右图是计算过程，其中

最低0.47元/天解锁文章

weixin_39936134

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
rnn神经网络模型_循环神经网络——反对称RNN模型

本文主要介绍的是循环神经网络RNN及其研究进展，其中的主要内容来自于一篇2019年的ICLR论文，论文原文如下AntisymmetricRNN: A Dynamical System View on Recurrent Neural Networksarxiv.org一、RNN与LSTM在机器学习领域中，循环神经网络（RNN）可以说是一块相当重要的组成部分了，由于它能够在处理新数据的时候将之前的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。