LSTM:长短期记忆网络

最新推荐文章于 2023-12-20 22:08:02 发布

HatcherRobotics

最新推荐文章于 2023-12-20 22:08:02 发布

阅读量342

点赞数

分类专栏：感知，融合与预测文章标签： lstm 深度学习人工智能

本文链接：https://blog.csdn.net/weixin_44706018/article/details/128243944

版权

感知，融合与预测专栏收录该内容

9 篇文章 0 订阅

订阅专栏

LSTM:长短期记忆网络

理论
实践

理论

在这里插入图片描述

LSTM的核心是细胞状态，用贯穿细胞的水平线表示
在这里插入图片描述

1.计算遗忘门

在这里插入图片描述
决定细胞状态需要舍弃哪部分无用信息

$f_t = \sigma{_g} (W_f x_t+U_f h_{t-1}+b_f)$

2.计算输入门

在这里插入图片描述
决定细胞状态需要添加哪些有用信息

$i_t = \sigma{_g}(W_i x_t+U_i h_{t-1}+b_i)$

3.计算候选细胞状态

$\widetilde{c}_t=\sigma{_c}(W_cx_t+U_ch_{t-1}+b_c)$

4.更新细胞状态

在这里插入图片描述

$c_t=f_t \circ c_{t-1}+i_t \circ \widetilde{c}_t$

5.计算输出门

控制细胞状态中哪些信息被输出
$o_t=\sigma{_g}(W_ox_t+U_oh_{t-1}+b_o)$

6.计算输出隐状态

$h_t = o_t \circ \sigma{_h}(c_t)$

实践

从零实现LSTM

class My_LSTM(nn. Module):
    def __init__(self, input_size, hidden_size, output_size):
        super().__init__()
        self.hidden_size = hidden_size
        self.gates = nn.Linear(input_size + hidden_size, hidden_size * 4)
        self.sigmoid = nn.Sigmoid()
        self.tanh = nn. Tanh()
        self.output = nn.Sequential(
            nn.Linear(hidden_size, hidden_size // 2),
            nn.ReLU(),
            nn.Linear(hidden_size // 2, output_size)
        )
        for param in self.parameters():
            if param.dim() > 1:
                nn.init.xavier_uniform_(param)

    def forward(self, x):
        batch_size = x.size(0)
        seq_len = x.size(1)
        h, c = (torch.zeros(batch_size, self.hidden_size).to(x.device) for _ in range(2))
        y_list = []
        for i in range(seq_len):
            forget_gate, input_gate, output_gate, candidate_cell = \
                self.gates(torch.cat([x[:, i, :], h], dim=-1)).chunk(4, -1)
            forget_gate, input_gate, output_gate = (self.sigmoid(g)
                                                    for g in (forget_gate, input_gate, output_gate))
            c = forget_gate * c + input_gate * self.tanh(candidate_cell)
            h = output_gate * self.tanh(c)
            y_list.append(self.output(h))
        return torch.stack(y_list, dim=1), (h, c)

Pytorch实现LSTM

参数

在这里插入图片描述

输入

在这里插入图片描述

输出

在这里插入图片描述

lstm = nn.LSTM(input_size=input_size,hidden_size=hidden_size,num_layers=1,batch_first=True).to(device)

HatcherRobotics

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LSTM:长短期记忆网络

LSTM:长短期记忆网络
复制链接

扫一扫

专栏目录