LSTM 变体

长短期记忆网络LSTM的变体

1.peephole connection

Gers & Schmidhuber 于2000年提出,增加了peephole connection,变化是门(包括遗忘门,输入门)都可以接受上一个细胞(神经元)的输入

在上面这个原始的LSTM的细胞/神经元的网络结构图中.演化为下面这种结构,这个结构图的三条红线使得每个门都可以接收,上一个细胞的状态C_{t-1},修改过后的计算公式如下

 其中,h(t-1)是上一个时刻的隐藏层状态,x(t)是本时刻的细胞或者神经元的输入,f(t-1),i(t),o(t)分别表示,忘记门,输入门,输出门.

2. 耦合(coupled)遗忘和输入单元

我们都知道,原始的LSTM网络将遗忘门和更新的过程是分开的,但是这种LSTM网络将遗忘门和新记忆两个过程结合起来,即只遗忘那些有新元素来填充的元素.

 

而且,相应的更新公式也要发生变化.

C_{t} = f_{t}\bigotimes C_{t-1} + (1 - f_{t})\bigotimes C_{t}^{`}

3 门循环单元(Gated Recurrent Unit,GRU)

Cho等人于2014年提出,其混合了长期状态和隐藏状态

 GRU只有两个门:重置(Reset)门r_{t}和更新门(update)Z_{t},取消了LSTM中的输出门.R和Z共同控制了如何从之间隐藏状态h_{t-1}计算获得新的隐藏状态h_{t}.重新的计算公式

相关论文:Cho K,Van Merrienboer B,Gulcehre C,et al. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation[J]. Eprint Arxiv, 2014

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值