Torch_5_LSTM 探究一下模型定义与输入数据的参数设置

aaaaaaze

已于 2022-08-08 15:25:36 修改

阅读量1.4k

点赞数 2

分类专栏： Path2DL 文章标签： lstm 深度学习 rnn python

于 2022-05-10 11:11:47 首次发布

本文链接：https://blog.csdn.net/aaaaaaze/article/details/124488318

版权

Path2DL 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

CNN跳了

数据流

在这里插入图片描述
在传统RNN的基础之上，通过设置cell对以往状态的遗忘程度，使模型更好的拟合数据。
在数据流中，定义了 $I 、 F 、 O$ 和 $\tilde{\mathbf{C}}$ ，有
$\begin{aligned} \mathbf{I}_t &= \sigma(\mathbf{X}_t \mathbf{W}_{xi} + \mathbf{H}_{t-1} \mathbf{W}_{hi} + \mathbf{b}_i),\\ \mathbf{F}_t &= \sigma(\mathbf{X}_t \mathbf{W}_{xf} + \mathbf{H}_{t-1} \mathbf{W}_{hf} + \mathbf{b}_f),\\ \mathbf{O}_t &= \sigma(\mathbf{X}_t \mathbf{W}_{xo} + \mathbf{H}_{t-1} \mathbf{W}_{ho} + \mathbf{b}_o),\\ \tilde{\mathbf{C}}_t &= \text{tanh}(\mathbf{X}_t \mathbf{W}_{xc} + \mathbf{H}_{t-1} \mathbf{W}_{hc} + \mathbf{b}_c),\\ \end{aligned}$
通过 $I$ 控制当前输入对状态的影响，通过 $F$ 控制之前状态的影响， $O$ 来控制隐藏状态 $H_t$ 。表示为
$\mathbf{C}_t = \mathbf{F}_t \odot \mathbf{C}_{t-1} + \mathbf{I}_t \odot \tilde{\mathbf{C}}_t.\\ \mathbf{H}_t = \mathbf{O}_t \odot \tanh(\mathbf{C}_t).$

模型定义

import torch
lstm = torch.nn.LSTM(input_size=28, hidden_size=256, num_layers=1)

其中

input_size为输入 $x_t$ 中的那个 $t$ ，表示输入层的 $ce ll$ 数量
hidden_size为隐藏层的大小，表示单个 $ce ll$ 内 $H_t$ 的复杂程度
num_layers为网络层数，用于构建深层LSTM

模型输入

输入有两个部分，inputs和(h_0, c_0)

inputs 的形状应为 $sequence\_length, batch\_size, input\_size)$ , 分别为

sequence_length，一次输入的序列长度，输入的大小。不需要和其他部分匹配，就是说可以随意修改而不会引起模型报错。
batch_size
input_size，与模型定义中相同

inputs = torch.randn(35, 32, 28)

(h_0, c_0)表示模型 $H_0$ 和 $C_0$ 的初始化参数，元组，省略时以 $0$ 替代。
它们的形状都应是 $D∗num\_layers,batch\_size,hidden\_size)$

D表示方向，双向LSTM为2，单向为1
num_layers，batch_size，hidden_size与上述定义相同

h = (torch.randn(1, 32, 256),
     torch.randn(1, 32, 256))

模型输出

输出也是两部分，output和(h_n, c_n)

output形状为 $sequence\_length,batch\_size,D∗hidden\_size )$
上面都定义过了

(h_n, c_n)状态与(h_0, c_0)相同，只是表示计算结束后的隐藏状态

out, h_new = lstm(inputs)

在这里插入图片描述

可通过设置lstm=nn.LSTM(*args, batch_first=True), 改变输入输出的形状顺序，将batch_size的位置从shape[1]改为shape[0]

~~真的绕腾~~

aaaaaaze

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Torch_5_LSTM 探究一下模型定义与输入数据的参数设置

LSTM定义与形状设置
复制链接

扫一扫

专栏目录