多线程生成批次时debug

项目场景:

针对上一篇博客机器学习为什么要分批次训练?-CSDN博客,考虑到训练集有50,000个数据,测试集有10,000个数据,单线程读取的时候比较耗费时间,所以引用多线程读取的方法


问题描述

在DataLoader直接设置num_workers进行多线程的设置出现以下报错:

RuntimeError:
        An attempt has been made to start a new process before the
        current process has finished its bootstrapping phase.

        This probably means that you are not using fork to start your
        child processes and you have forgotten to use the proper idiom
        in the main module:

            if __name__ == '__main__':
                freeze_support()
                ...

        The "freeze_support()" line can be omitted if the program
        is not going to be frozen to produce an executable.

原因分析:

在Python的多进程模块中,如果主模块启动了一个新的进程,那么主模块的代码会在新的进程中再次启动执行。但子进程执行的只能是功能块的代码,像是函数或者类。

如果主模块内的全局范围内有代码,并且这些代码在启动新的子进程,那么在子进程再次执行这些全局范围的代码时,会再次启动新的子进程,导致无限的递归创建进程,于是程序会抛出 RuntimeError。


解决方案:

解决这个问题的一个常见做法是,将启动新进程的代码放在 if __name__ == '__main__': 的保护块中。根据Python的运行机制,在子进程中运行主模块时,__name__ 不会等于 '__main__'。所以,这样可以防止子进程再次执行主模块全局范围内的代码。

也就是在主模块中运行部分加上  if __name__ == '__main__': 接下的代码内容再进行缩进,就可以解决这个bug问题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值