- 有的博客说是什么torch版本问题,但是根本不存在,你安装的torch的cuda版本一定是低于机器版本的。所以就是两个地方需要改进:
-
GPUS_PER_NODE=2 #有几张卡就是写几 batch_size调小
raise ChildFailedError(torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
最新推荐文章于 2025-02-15 12:15:34 发布
GPUS_PER_NODE=2 #有几张卡就是写几
batch_size调小