在两个节点运行 MPI 程序时,出现以下错误:
[proxy:0:1@node2] HYDU_sock_connect (../../utils/sock/sock.c:224): unable to get host address for node1 (2)
[proxy:0:1@node2] main (../../pm/pmiserv/pmip.c:453): unable to connect to server node1 at port 59268 (check for firewalls!)
该错误是由于客户端不连接到服务器引起的,因为它不知道服务器的IP。
解决方法:
将每个主机名和相关 ip 添加到客户端的 /etc/hosts 中,即
192.168.100.1 node1
192.168.100.2 node2
这样就允许主节点和节点客户端的双向通信。