store = TCPStore(master_addr, master_port, world_size, start_daemon, timeout) RuntimeError
store = TCPStore(master_addr, master_port, world_size, start_daemon, timeout)
RuntimeError
在使用swin transformer模型做pytorch分布式训练时,调试过程中,出现上面的报错信息,终止当前正在运行的程序,再次打开该程序进行调试,即可恢复正常。原因暂时还没有搞懂,后续懂了会继续记录。