今天解决了一个大的问题,如下:
RuntimeError: The server socket has failed to listen on any local network address. The server socket
python -m torch.distributed.launch --nproc_per_node=2 --master_port='29501' trainB.py
其实就是相当于改变一下端口号就可以啦,之前也看到过这个帖子,但是没有仔细看,所以 --master_port='29501' 加错了位置,放在了 trainB.py 是不对的,做事情要有耐心和恒心,静下心来,你可以的!!!