LSTM学习笔记

LSTM简介

1.LSTM简介

LSTM(Long Short-Term Memory)网络是循环神经网络的一个变体,是一种时间序列循环神经网络,是为了解决简单循环神经网络存在的长期依赖问题而设计的。

LSTM分析

LSTM分析

LSTM结构结构如下图所示。
alt
LSTM中的门控机制:LSTM网络引入门控机制来控制信息传递的路径。
alt
LSTM网络中三个门的作用为:
1)遗忘门ft控制上一个时刻的内部状态ct-1需要遗忘多少信息。
2)输入门it控制当前的候选状态有多少信息需要保存。
3)输出门ot控制当前时刻的内部状态ct有多少信息需要输出给外部状态ht。
三个门的计算方式如下:
alt

alt
tensorflow中
tf.nn.rnn_cell.BasicLSTMCell(num_units=n),num_units是隐藏层的神经元个数,说白了就是cell中图中每个黄色小方框的维度或者输出外部状态ht的向量维度。

多层LSTM

多层LSTM就是将上一层输出的外部状态ht作为当前层的输入。
alt
本文查阅了很多相关资料,将LSTM的内部结构做了剖析,以及对多层LSTM的结构通过图示的形式做了阐释。后续随着应用以及知识的加深,会不定时更新该文档。如果文中有错误的地方,欢迎指正,互相促进,互相学习。

参考文献

[1] https://blog.csdn.net/Hello_word5/article/details/88918075
[2] 邱锡鹏.神经网络与深度学习

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值