Pytorch GPU由于num_workers读取lmdb格式引发的BUG Cannot re-initialize CUDA&TypeError: can't pickle odict_keys

最新推荐文章于 2024-05-07 17:19:42 发布

要不要来点小九九

最新推荐文章于 2024-05-07 17:19:42 发布

阅读量1.5k

点赞数

分类专栏：人工智能 pytorch 文章标签： pytorch 机器学习深度学习

本文链接：https://blog.csdn.net/zhaominyiz/article/details/104986682

版权

人工智能同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

pytorch

4 篇文章 0 订阅

订阅专栏

如果你遇到了如下的BUG：

1、"Cannot re-initialize CUDA in forked subprocess. " + msg) RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

官方解决方案：https://discuss.pytorch.org/t/not-using-multiprocessing-but-getting-cuda-error-re-forked-subprocess/54610

2、C:\ProgramData\Anaconda3\lib\multiprocessing\reduction.py in dump(obj, file, protocol) 58 def dump(obj, file, protocol=None): 59 '''Replacement for pickle.dump() using ForkingPickler.''' ---> 60 ForkingPickler(file, protocol).dump(obj) 61 62 # TypeError: can't pickle odict_keys objects

官方解决方案：https://discuss.pytorch.org/t/dataloader-issues-with-multiprocessing-when-i-do-torch-multiprocessing-set-start-method-spawn-force-true/69275

等等这似乎是个windows版独有问题，但是我在linux上也有遭遇

你可能可以通过

1、设置工作模式：torch.multiprocessing.set_start_method('spawn')

2、用main包起来

import torch

def main()
    for i, data in enumerate(dataloader):
        # do something here

if __name__ == '__main__':
    main()

3、设置num_workers为0解决

但是使用第三个方法等于向邪恶势力低头

你可以使用linux系统，然后依旧设置>0的num_workers。在dataloader读取数据前，即上述代码第四行前，保证读取的数据是在cpu中，随后再移入gpu中，进行网络的运算。

要不要来点小九九

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pytorch GPU由于num_workers读取lmdb格式引发的BUG Cannot re-initialize CUDA&TypeError: can't pickle odict_keys

如果你遇到了如下的BUG：1、"Cannot re-initialize CUDA in forked subprocess. " + msg) RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' star...
复制链接

扫一扫