0.环境
ubuntu16.04
pytorch1.1.0
1.问题
RuntimeError: [enforce fail at /pytorch/third_party/gloo/gloo/transport/tcp/device.cc:127] rp != nullptr. Unable to find address for: my_username
说找不到my_username地址。
2.解决问题
(1)通过查询资料:
即使有上面的,对docker不是很了解也很难解决。不要一言不合就删除docker container,问问熟悉这些的人,有时候一两句话还是挺重要的不一定能帮你解决问题,但是有启发啊。
(2)退出docker,在外面通过ifconfig查询,发现docker使用的是docker0,其他的机器是docker里面是不知道的。
最后通过声明地址解决:
export GLOO_SOCKET_IFNAME=docker0
参考