pytorch使用-nn.RNN

大虾飞哥哥

已于 2023-11-08 09:10:18 修改

阅读量3.9k

点赞数 3

分类专栏： pytorch 文章标签： pytorch

于 2022-04-07 16:56:47 首次发布

本文链接：https://blog.csdn.net/xu624735206/article/details/124017563

版权

pytorch 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

pytorch使用-nn.RNN

一、nn.RNN 定义
二、nn.RNN 输入 input, h_0
三、nn.RNN 输出 output, h_n
四、测试
五、RNN 网络

一、nn.RNN 定义

在这里插入图片描述

对于输入序列中的每个元素，每一层计算以下函数：
在这里插入图片描述

nn.RNN(input_size: int, hidden_size: int,
       num_layers: int = 1, bias: bool = True, batch_first: bool = False,
       dropout: float = 0., bidirectional: bool = False)

input_size：输入特征的维度，一般rnn中输入的是词向量，那么 input_size 就等于一个词向量的维度。
hidden_size：隐藏层神经元个数，或者也叫输出的维度（因为rnn输出为各个时间步上的隐藏状态）。
num_layers：网络的层数。
nonlinearity：激活函数。
bias：是否使用偏置。
batch_first：输入数据的形式，默认是 False，就是这样形式，(seq(num_step), batch, input_dim)，也就是将序列长度放在第一位，batch 放在第二位。
dropout：是否应用dropout, 默认不使用，如若使用将其设置成一个0-1的数字即可。
birdirectional：是否使用双向的 rnn，默认是 False。

二、nn.RNN 输入 input, h_0

input 形状：当设置 batch_first = False 时， $L, N, H_{in})$ —— [时间步数, 批量大小, 特征维度]
当设置 batch_first = True时， $N, L, H_{in})$

当输入只有两个维度且 batch_size 为 1 时： $L, H_{in})$ 时，需要调用 torch.unsqueeze() 增加维度。

h_0 形状： $D * {num\_layers}, N, H_{out})$ , D 代表单向 RNN 还是双向 RNN。
在这里插入图片描述

三、nn.RNN 输出 output, h_n

output 形状：当设置 batch_first = False 时， $L, N, D * H_{out})$ —— [时间步数, 批量大小, 隐藏单元个数]；
当设置 batch_first = True 时， $N, L, D * H_{out})$ 。

h_n 形状： $num_layers , N , H o u t ) (D * \text{num\_layers}, N, H_{out})$

四、测试

import torch
import torch.nn as nn

# 输入维度5， 隐藏层维度10， 一层网络
rnn = nn.RNN(5, 10, 1)

# 初始化 input - one_hot 编码, 时间步数=2, batch_size=1, input_size=5,

input = torch.tensor([[0, 1, 0, 0, 0],
                      [0, 0, 0, 1, 0]], dtype=torch.float32)

print(input.size())

# 扩展 batch_size 维度为 1
input = input.unsqueeze(1)
print("输入维度")
print(input.size())

# 初始化 h_0 - (D, N, H_out)
hidden = torch.randn(1, 1, 10)
print(hidden.size())

# 调用 rnn
output, h_n = rnn(input, hidden)

print("输出维度")
print(output.size())
print(h_n.size())

在这里插入图片描述

五、RNN 网络


class RNN(nn.Module):

    def __init__(self, input_size, hidden_size, output_size, num_layers=1):

        super(RNN, self).__init__()

        self.num_layers = num_layers
        self.hidden_size = hidden_size

        self.rnn = nn.RNN(input_size, hidden_size, num_layers)
        self.linear = nn.Linear(hidden_size, output_size)
        self.softmax = nn.LogSoftmax(dim=-1)

    def forward(self, input_data, hidden):

        input_data = input_data.unsqueeze(0)
        rr, hn = self.rnn(input_data, hidden)

        return self.softmax(self.linear(rr)), hn

    def init_hidden(self):

        return torch.zeros(self.num_layers, 1, self.hidden_size)

大虾飞哥哥

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
1
评论
pytorch使用-nn.RNN

pytorch使用-nn.RNN一、nn.RNN一、nn.RNNnn.RNN(input_size: int, hidden_size: int, num_layers: int = 1, bias: bool = True, batch_first: bool = False, dropout: float = 0., bidirectional: bool = False, proj_size: int = 0, device=None, dtype=No
复制链接

扫一扫