LSTM的详细计算过程

1 LSTM总体框架

LSTM模型是由时刻的输入词 X t X_{t} Xt,细胞状态 C t C_{t} Ct ,临时细胞状态 C t ~ \widetilde{C_{t}} Ct ,隐层状态 h t h_{t} ht,遗忘门 f t f_{t} ft,记忆门 i t i_{t} it,输出门 o t o_{t} ot组成。LSTM的计算过程可以概括为,通过对细胞状态中信息遗忘和记忆新的信息使得对后续时刻计算有用的信息得以传递,而无用的信息被丢弃,并在每个时间步都会输出隐层状态 h t h_{t} ht,其中遗忘,记忆与输出由通过上个时刻的隐层状态 h t − 1 h_{t-1} ht1和当前输入 X t X_{t} Xt计算出来的遗忘门 f t f_{t} ft,记忆门 i t i_{t} it,输出门 o t o_{t} ot来控制。
在这里插入图片描述

图1. LSTM总体框架

2 LSTM计算过程

2-1 计算遗忘门

计算遗忘门,选择要遗忘的信息。

输入:前一时刻的隐层状态 h t − 1 h_{t-1} ht1,当前时刻的输入词 X t X_{t} Xt
输出:遗忘门的值 f t f_{t} ft

在这里插入图片描述

图2-1. 计算遗忘门

2-2 计算记忆门

计算记忆门,选择要记忆的信息。

输入:前一时刻的隐层状态 h t − 1 h_{t-1} ht1,当前时刻的输入词 X t X_{t} Xt
输出:记忆门的值 i t i_{t} it,临时细胞状态 C t ~ \widetilde{C_{t}} Ct
在这里插入图片描述

图2-2. 计算记忆门和临时细胞状态

2-3 计算当前时刻细胞状态

计算当前时刻细胞状态

输入:记忆门的值 i t i_{t} it,遗忘门的值 f t f_{t} ft,临时细胞状态 C t ~ \widetilde{C_{t}} Ct ,上一刻细胞状态 C t − 1 C_{t-1} Ct1
输出:当前时刻细胞状态 C t C_{t} Ct

在这里插入图片描述

图2-3. 计算当前时刻细胞状态

2-4 计算输出门和当前时刻隐层状态

计算输出门和当前时刻隐层状态

输入:前一时刻的隐层状态 h t − 1 h_{t-1} ht1,当前时刻的输入词 X t X_{t} Xt,当前时刻细胞状态 C t C_{t} Ct
输出:输出门的值 o t o_{t} ot,隐层状态 h t h_{t} ht

在这里插入图片描述

图2-4. 计算输出门和当前时刻隐层状态

最终,我们可以得到与句子长度相同的隐层状态序列{ h 0 h_{0} h0, h 1 h_{1} h1, …, h n − 1 h_{n-1} hn1}。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mingo_敏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值