LSTM结构解析

一、问题引入

长短期记忆神经网络:LSTM(long short-term memory)作为一种改进之后的循环神经网络,不仅能够解决 RNN无法处理长距离的依赖的问题,还能够解决神经网络中常见的梯度爆炸或梯度消失等问题,在处理序列数据方面非常有效。对RNN问题请看RNN结构解析这篇文章。
LSTM基本思想

LSTM单元不仅接受 xt 和 ht-1,还需建立一个机制(维持一个细胞状态Ct) 能保留前面远处结点信息在长距离传播中不会被丢失。LSTM 通过设计“门”结构实现保留信息和选择信息功能。

在这里插入图片描述

二、LSTM结构

①网络结构
在这里插入图片描述
②单元结构
由遗忘门、输出门、输入门组成。
在这里插入图片描述
在这里插入图片描述
ht是隐藏状态,表示短期记忆;ct是细胞状态,表示长期记忆。
在这里插入图片描述

三、GRU

LSTM细胞的一种变体被称为门控循环单元,简称GRU(Gated Recurrent Unit)。GRU 是Kyunghyun Cho等人在2014年的一篇论文中提出的。LSTM 简化: 输入门和遗忘门合并为更新门(更新门决定隐状态保留放弃部分)。
GRU是LSTM细胞的简化版本,速度比LSTM快一点,而且性能似乎也与LSTM相当,这就是它为什么越来越受欢迎的原因。

在这里插入图片描述
在这里插入图片描述
双向LSTM
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值