LSTM笔记

前言

Understanding LSTM Networks
这篇博客应该是所有学习LSTM的同学必看而且一看就会的博客了。我看了无数遍,忘了无数遍,所以还是写一篇总结记录一下……

正文

先放一张LSTM的整体图:
这里写图片描述
看上去好复杂……但是不用担心,分解开看的话是非常清晰简单的。

核心思想

LSTM的key是cell state,即细胞状态,就是下图中的横线。它像一条传送带一样贯通整个网络,在每个time step都会进行信息或者叫状态的修改。
这里写图片描述

对cell state的三种操作
  1. Forget
  2. Input
  3. Output
1. Forget

这里写图片描述
图中表示的很清晰,不再赘述。

2. Input

可能这里叫increment更合适一点。有两部分组成,先看图:
这里写图片描述

  • Input gate layer:即左边的 σ σ ,决定了要增加哪些量。
  • Candidate values:即右边的 tanh t a n h ,决定了增量的具体值。

有了forgetinput,就可以更新我们的Cell state了。见图:
这里写图片描述

3. Output

这里写图片描述
很显然,output的核心还是cell state。还是有两部分:

  • Onput gate layer:由 ht1 h t − 1 xt x t 共同决定。
  • Candidate values:由Cell state决定。
    需要注意的一点是,输出的 ht h t 被复制了两份,一份作为了当前time step的输出,另一份作为了下一time step的输入。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值