深度学习-RNN LSTM BI-LSTM

本文介绍了循环神经网络RNN及其存在的梯度消失和梯度爆炸问题,然后详细阐述了LSTM如何通过门控机制解决这些问题,包括输入门、遗忘门和输出门的作用,以及细胞状态的更新过程。通过对LSTM的简化表示,揭示了其在信息传递上的优势。
摘要由CSDN通过智能技术生成

RNN 循环神经网络
RNN主要处理有时序关系的变长序列问题。每个神经元在每一时刻都一个特殊的hidden状态h(t),由当前节点的输入I(t)和上一时刻t-1隐藏状态h(t-1)加权求和后经过一个非线性激活函数得到,具体表示成公式如下:
在这里插入图片描述
每个神经元t时刻隐状态
在这里插入图片描述
参数Whh决定了当前神经元以多少比例接受之前所有时刻[0,t-1]的输入信息

阻碍RNN发展的两个严重问题是:梯度爆炸 和 梯度消失、

RNN的对隐状态h(0)进行反向传播:
在这里插入图片描述
利用RNN时序上的依赖关系对上式在这里插入图片描述进行展开,得到(注意,下式成立的前提是激活函数简化为线性函数):
在这里插入图片描述
继续对

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值