我这是 内存不足的问题。
可以关注任务管理器验证下。
解决方法:
调小batchsize
多卡训练 自动关闭 torch.distributed.elastic.multiprocessiong.erroes.ChildFailedError
最新推荐文章于 2024-05-13 19:40:56 发布
我这是 内存不足的问题。
可以关注任务管理器验证下。
解决方法:
调小batchsize