在测试pytorch多卡的时候报错:
store = TCPStore(master_addr, master_port, world_size, start_daemon, timeout)
RuntimeError: Address already in use
经查,是还有另外一个任务也在用DDP跑,解决方案:
手动指定一个空闲端口
python -m torch.distributed.launch --master_port 145622
查看端口占用情况:
终端输入
netstat -nultp