LSTM 详细理解

LSTM是一种特殊的循环神经网络,设计用于处理时间序列数据,能有效缓解传统RNN的梯度消失和爆炸问题,从而更好地捕捉长期依赖。然而,随着序列长度增加,LSTM的表现可能不及self-attention机制。
摘要由CSDN通过智能技术生成

LSTM 定义:
全称 Long Short Term Memory (长短期记忆) 是一种循环神经网络,LSTM可以利用时间序列对输入进行分析。
LSTM计算公式:在这里插入图片描述

LSTM优缺点:
在这里插入图片描述
RNN容易出现网络神经中的两个问题:梯度消失和梯度爆炸。梯度消失是指权重/偏置梯度极小,导致神经网络参数调整率急速下降;梯度爆炸:指权重/偏置梯度极大,导致神经网络参数调整过大,矫枉过正。

LSTM 优点:
LSTM最初用来解决一般神经网络中普遍存在的长期依赖问题,使用LSTM可以有效的传递和表达长时间序列中的信息并且不会导致长时间前的有用信息被忽略(遗忘)。与此同时,LSTM还可以解决RNN中的梯度消失/爆炸问题。
LSTM缺点:
随着文本的增长,LSTM不如self-attention机制。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值