在我跑SLADD模型的时候,出现了如下报错:
上网搜寻一番后,发现了解决方法
第一步:在本文件的开头机上这样两行代码:
import os
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"
第二步:在本文件代码中找到这样一部分代码:
把dist.init_process_group(backend='nccl', init_method='env://', world_size=args.world_size, rank=rank)
这一行中的nccl换成gloo
若要解释原因就是windows系统不支持NCCL,只能换用GLOO
亲测这个报错就没了,然而接下来还有好多别的报错…我继续去解决了,解决完再分享别的~