subprocess.CalledProcessError: Command xxx returned non-zero exit status 1.

本文详细阐述了mmdetection中分布式训练时遇到的子程序中断问题及其处理建议,涉及代码调试、环境设置和单卡测试等内容。
摘要由CSDN通过智能技术生成

关于mmdetection使用pytorch进行分布式训练时遇到的子程序中断问题,建议的解决方法如下:

1. 检查Trace Back的提示,如果是自己代码编写的问题,则根据提示修改代码;

2. 若非代码编写问题(提示可能为python本身的问题),可以尝试:

  • 重新编译/加载环境;
  • 改用单卡跑相同的代码,报错位置会更加具体;

如果你已经尝试过其他各种方法都没用,我比较推荐使用单卡跑的方式,快速准确!

如有指正,欢迎文明评论交流!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值