BrokenPipeError: [Errno 32] Broken pipe和ValueError: persistent_workers option needs num_workers ＞ 0

最新推荐文章于 2024-06-21 20:56:10 发布

Together_CZ

最新推荐文章于 2024-06-21 20:56:10 发布

阅读量1.6k

点赞数 2

分类专栏：机器学习深度学习文章标签： pytorch 深度学习人工智能

本文链接：https://blog.csdn.net/Together_CZ/article/details/126539598

版权

机器学习同时被 2 个专栏收录

284 篇文章 57 订阅

订阅专栏

深度学习

167 篇文章 36 订阅

订阅专栏

在使用PyTorch类的项目在windows环境下运行的时候尤其是CPU模式下运行的时候经常就会报各种各样的错误，尤其是跟DataLoader相关的，这里的报错就是因为DataLoader在windows下多线程加载数据集报错导致的，感觉torch对这个问题好像一直没有提上日程去解决它。

原始代码如下：

我常用的解决方法就是将nw值改为0即可，事实上这样的确也是起作用的。

但是今天我这么修改的时候又报错了，如下所示：

详情如下：

ValueError: persistent_workers option needs num_workers > 0

感觉这里的问题是由于persistent_workers参数导致的，我查询了一下DataLoader中的persistent_workers参数：

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False,
drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, *, prefetch_factor=2,
persistent_workers=False)

如果persistent_workers为True，数据加载器将不会在数据集运行完一个Epoch后关闭worker进程。这允许维护worker数据集实例保持激活。(默认值:False)

意思是运行完一个Epoch后并不会关闭worker进程，而是保持现有的worker进程继续进行下一个Epoch的数据加载。好处是Epoch之间不必重复关闭启动worker进程，加快训练速度。

也就是说作者这里设定persistent_workers为TRUE是为了提升训练速度，但是按照解决多进程数据加载报错的方法无意间触发了【num_workers > 0】的硬性要求，所以这里兼顾训练速度的办法就是将nw值改为1，如下：

当然了也可以选择将persistent_workers设置为False，如下：

重新执行，可以看到模型已经正常训练开始了：

记录备忘！

Together_CZ

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
BrokenPipeError: [Errno 32] Broken pipe和ValueError: persistent_workers option needs num_workers ＞ 0

在使用PyTorch类的项目在windows环境下运行的时候尤其是CPU模式下运行的时候经常就会报各种各样的错误，尤其是跟DataLoader相关的，这里的报错就是因为DataLoader在windows下多线程加载数据集报错导致的，感觉torch对这个问题好像一直没有提上日程去解决它。意思是运行完一个Epoch后并不会关闭worker进程，而是保持现有的worker进程继续进行下一个Epoch的数据加载。(默认值:False)我常用的解决方法就是将nw值改为0即可，事实上这样的确也是起作用的。...
复制链接

扫一扫