学习笔记2：深入理解LSTM代码

最新推荐文章于 2024-05-16 16:32:03 发布

疯狂的小羊肖恩

最新推荐文章于 2024-05-16 16:32:03 发布

阅读量1.1k

点赞数 21

文章标签：学习笔记 lstm

本文链接：https://blog.csdn.net/hyq99999/article/details/134659231

版权

本文详细介绍了LSTM的工作原理，包括输入、隐藏状态和cellstate，以及在PyTorch中如何构建LSTM网络的代码。重点讲解了`__init__`和`forward`函数的用途，以及全连接层在时间序列预测中的应用。

摘要由CSDN通过智能技术生成

结合上次文章深入理解LSTM的代码实现。

一、LSTM

输入：x^t 代表当前时刻下的输入，h^(t-1)表示上一时刻的hidden state，c^(t-1)代表上一时刻的cell state。x^t、h^(t-1)、c^(t-1)一起作为输入。

输出：h^t为当前时刻的hidden state，c^t为当前时刻的cell state

c^t=g(z)f(zi)+c^(t-1)f(zf)

其中，对于传递下去的 c^t 改变得很慢，而 h^t 则在不同节点下往往会有很大的区别。LSTM通过对 c^t 的利用尽可能长时间地保留信息

参考文章：LSTM 详解及其代码实现

二、LSTM的代码

总的代码如下：

import torch as t
import torch.nn as nn


class LstmNet(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, num_classes):
        # input_size输入元素个数，hidden_size隐藏层元素个数 和 num_layers隐藏层数
        super(LstmNet, self).__init__()
        # 隐藏单元数
        self.hidden_size = hidden_size
        # 隐藏层数
        self.num_layers = num_layers
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        # batch_first如果为True，那么输入和输出Tensor的形状为(batch,seq,feature)
        # 输出的全连接网络
        self.fc = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        # 通过x.size(0)获取 batch中的元素个数
        # h0 和 c0 的格式为：（层数*方向数，批次数，隐藏层数）
        b_size = x.size(0)
        h0 = t.zeros(self.num_layers, b_size, self.hidden_size)
        c0 = t.zeros(self.num_layers, b_size, self.hidden_size)
        lstm_out, _ = self.lstm(x, (h0, c0))
        fc_out = self.fc(lstm_out[:, -1, :])
        return fc_out