Pytorch调用RNN/LSTM/GRU问题

最新推荐文章于 2024-07-18 20:02:41 发布

Quanmator

最新推荐文章于 2024-07-18 20:02:41 发布

阅读量408

点赞数

分类专栏：日经文章标签： rnn pytorch lstm

本文链接：https://blog.csdn.net/qq_41961794/article/details/130394658

版权

日经专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Q1：调用GRU报错

报错代码：
terminate called after throwing an instance of 'c10::CUDAError' what(): CUDA error: an illegal memory access was encountered CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.

检查发现批量大小可能比较大，导致内存溢出。将batch_size从1024 修改为 500

Q2：修改batch大小后仍报错

报错代码：
ValueError: Expected input batch_size (21) to match target batch_size (256).

当时以为batch_size必须是21的倍数，因为笔者的concat_nframe等于21。将其改为420后，仍报错。

参考官方文档：

https://pytorch.org/docs/stable/generated/torch.nn.GRU.html?highlight=nn+gru#torch.nn.GRU

原来的代码为：

self.gru = nn.GRU(
            input_size = 39,
            hidden_size =  hidden_dim,
            num_layers = hidden_layers,
            bidirectional = True,
            dropout= drop_out
        )

由于没有设置batch_first = True,而我输入的数据的第一个维度为batch，导致维度不匹配，固报错

Quanmator

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pytorch调用RNN/LSTM/GRU问题

当时以为batch_size必须是21的倍数，因为笔者的concat_nframe等于21。将其改为420后，仍报错。由于没有设置batch_first = True,而我输入的数据的第一个维度为batch，导致维度不匹配，固报错。检查发现批量大小可能比较大，导致内存溢出。将batch_size从1024 修改为 500。
复制链接

扫一扫

专栏目录