RuntimeError: Pin memory thread exited unexpectedly

小馆长布鲁克

已于 2022-09-17 12:12:24 修改

阅读量3.5k

点赞数 12

分类专栏：深度学习系列

于 2022-09-17 12:07:01 首次发布

本文链接：https://blog.csdn.net/weixin_45686244/article/details/125223445

版权

深度学习系列专栏收录该内容

7 篇文章 0 订阅

订阅专栏

问题：

训练神经网络时修改num_worker时候出现如下报错：

RuntimeError: Pin memory thread exited unexpectedly

我的dataloader如下：

    num_workers = 1
    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size,
                                               num_workers=num_workers,
                                               shuffle=True,
                                               pin_memory=True,
                                               persistent_workers = False,
                                               collate_fn=train_dataset.collate_fn)

    val_loader = torch.utils.data.DataLoader(val_dataset,
                                             batch_size=1,
                                             num_workers=num_workers,
                                             pin_memory=True,
                                             persistent_workers = False,
                                             collate_fn=val_dataset.collate_fn)

很多教程让修改pin_memory和persistent_workers；但我还是会发生报错的情况。还有个方法是让把num_worker设置为0，这个方法确实可以，但我无法忍受训练过程如此慢，所以坚决不改num_worker。

问题解决：

在文件开头输入如下代码：

import torch.multiprocessing
torch.multiprocessing.set_sharing_strategy('file_system')

我的问题就解决了，原因分析应该是我的docker分配的缓存不够，这里的import可以解决这个问题。

小馆长布鲁克

关注

12
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
4
评论
RuntimeError: Pin memory thread exited unexpectedly

训练神经网络时修改num_worker时候出现如下报错：RuntimeError: Pin memory thread exited unexpectedly。在保持num_worker大于0的情况下已解决。
复制链接

扫一扫