LSTM&GRU

最新推荐文章于 2024-06-11 00:45:26 发布

~不二~

最新推荐文章于 2024-06-11 00:45:26 发布

阅读量394

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52820633/article/details/114695103

版权

RNN的梯度消失和爆炸问题导致其难以处理长期依赖。LSTM通过输入、输出和遗忘门解决这个问题，而GRU简化了LSTM的结构，但同样能有效处理长期依赖。Tanh和Sigmoid激活函数在RNN中起到调节信息流动的作用。

摘要由CSDN通过智能技术生成

文章目录

RNN神经网络短时记忆
激活函数
- Tanh
- Sigmoid
LSTM
GRU

RNN神经网络短时记忆

RNN神经网络与全连接神经网络类似，只不过RNN神经网络每一层都用同一组权重参数传递信息。
前向传递经过许多节点后，得到一个误差值，而在反向传播过程中，误差在每一步都会乘一个参数W，如果参数W<1，那经过不断与误差累乘，传到初试时间的时候，就可能会变成一个接近于0的数，所以对于初始时刻，误差就相当于消失了，这就是所谓的梯度消失，或者叫梯度离散；
在这里插入图片描述
反之，如果W>1，经过不断与误差累乘，就会得到一个特别大的数，RNN网络会被撑死，这就是梯度爆炸。

这就是普通的RNN无法回忆起久远记忆的原因。

激活函数

Tanh

激活函数 Tanh 用于帮助调节流经网络的值， tanh 函数将数值始终限制在 -1 和 1 之间。
在这里插入图片描述

Sigmoid

Sigmoid 把值压缩到 0~1 之间,这样的设

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LSTM&GRU

文章目录RNN神经网络短时记忆激活函数TanhSigmoidLSTMGRURNN神经网络短时记忆RNN神经网络与全连接神经网络类似，只不过RNN神经网络每一层都用同一组权重参数传递信息。前向传递经过许多节点后，得到一个误差值，而在反向传播过程中，误差在每一步都会乘一个参数W，如果参数W<1，那经过不断与误差累乘，传到初试时间的时候，就可能会变成一个接近于0的数，所以对于初始时刻，误差就相当于消失了，这就是所谓的梯度消失，或者叫梯度离散；反之，如果W>1，经过不断与误差累乘，就会得到一个
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。