与时间有关的神经网络 - RNN

x_fengmo

已于 2024-03-05 20:16:06 修改

阅读量159

点赞数

文章标签： rnn 神经网络

于 2023-08-28 10:36:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x_fengmo/article/details/132215595

版权

在进行对于联邦遗忘学习的问题研究上，考虑到是不是可能遗忘的程度或者数据是和时间有关的，所以不知道是不是可以使用长短期记忆网络，因此对于RNN和LSTM进行一定的学习

主要矛盾

使用什么样子的数据，输出什么样子的数据，解决什么样的问题

RNN

输入：与时间有关的序列

单层网络-经典RNN结构

RNN中提出了隐状态h(hidden state)的概念，隐状态h可以对序列形的数据提取特征，接着再转换为输出

RNN的计算是一种递推式的计算，其中使用的 $W, U, b$ 都是相同的参数，也就是说在RNN中的每个步骤参数是共享的（但是LSTM中不共享，因为RNN的权值是在同一个向量中，只是不同时刻而已），递推公式为 $h_i = f(Ux_i + Wh_{i-1} + b)$
在这里插入图片描述

RNN的输出值直接通过h进行计算，输出同样是共享参数，计算公式为 $y_i = softmax(Vh_i + c)$
在这里插入图片描述

通过观察可以看到RNN的输入和输出的序列长度必须是等长的。

RNN的应用

RNN可以被用来使用先前的事件推断后续的事件，而不是在推断后面事件的时候从零推断。

如果将上面的结构无限延长，那么这个屏幕的横向估计也放不下，之前提到这个结构的公式可以写成一个递推公式，那何不将结构也画成一个递推的结构？
在这里插入图片描述
将上面的递推结构用公式表达一下， $h_t = softmax[V(Ux_t + Wh_{t - 1} + b) + c]$

链式的特征揭示了RNN本质上是与序列和列表有关的，但是RNN的弊端就是他会丧失学习非常远的信息的能力，RNN会受到短时记忆的影响，如果序列足够长，那他们很难将信息从较早的时间步传送到后面的时间步。

LSTM

Long Short Term网络，是一种特殊类型的RNN，可以学习长期依赖的信息，它和RNN没有什么特别大的结构的不同，只是使用了不同的函数计算隐状态。

粗略总结

RNN倾向近期记忆的影响，LSTM倾向于长期记忆的影响

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

x_fengmo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。