Pytorch RNN爬坑指南（维数篇）

最新推荐文章于 2023-01-29 18:22:02 发布

PenguinLeee

最新推荐文章于 2023-01-29 18:22:02 发布

阅读量385

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_43466027/article/details/115827763

版权

14 篇文章 0 订阅

订阅专栏

在实现RNN的时候遇到了一些问题，主要还是各种size没有搞清楚，特开一帖记录一下。

下图是pytorch中的RNN模块的原理图（图片来源见水印）：
在这里插入图片描述
在PyTorch中可以使用下面两种方式去调用：

class RNN(input_size, hidden_size, num_layers=1, bias=True, batch_first=False, dropout=0., bidirectional=False):

上述RNN默认为是图中的一层隐藏层结构。

参数解释：

input_size：输入的 $x$ 的维度
hidden_size：隐藏层 $h$ 的维度
num_layers：隐藏层数，默认为1（即上图），若是大于1则意味着在上图中 $h$ 作为接续的RNN单元的输入，如下图：

当然了，这个图画的是双向RNN，咱们只看图的实线部分就可以了，num_layers大于1说的就是这种情况。但是这里似乎只能加入和h同样size的RNN单元，要想改变一下的话可能还需要自己手动实现
bias：偏置项
batch_first：在输入张量中batch放在第一位。这里的batch指我们同时扔进去多个序列。
原本的输入：(seq_len, batch, feature)，batch_first = True时的输入：(batch, seq_len, feature)

dropout和bidirectional略…

在调用RNN时，一般地：

out, h_o = RNN(input, h_i)

这里，假设没有开启baytch_first，则：

对于输入参数而言：

对于返回结果而言：

举例：

rnn = nn.RNN(10, 20, 2)  
input = torch.randn(5, 3, 10)  
h0 = torch.randn(2, 3, 20)  
output, hn = rnn(input, h0)

关注