mpirun运行mdtest挂死

描述:p137节点,执行mpirun测试mdtest挂死,配置文件:p139 slots=1

strace跟踪

挂死在了poll阶段:
poll([{fd=5, events=POLLIN}, {fd=4, events=POLLIN}, {fd=7, events=POLLIN}, {fd=13, events=POLLIN}], 4, 4294967295Process 4490 detached

 

根据strace结果,无法分析出原因。

转而查看端口

在p137节点,执行netstat –anp | grep mpi查看mpi建立TCP连接使用的端口为33229,ssh到p139节点,执行netstat –anp | g rep 33229,查看p139节点,监听该端口所用的对端的IP为:172.15.55.167(p137节点的IP),该IP不通,问题原因找到。

解决

将p137节点不通的IP用ifdown命令关闭即可。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值