LSF错误排查:为什么任务状态自动切换为PSUSP ?

用户向LSF提交了一个交互式任务,但任务状态自动变成PSUSP。

PSUSP状态通常是在提交任务时指定了 -H参数,即要求任务保持挂起状态,只有当用户恢复任务后才等候被LSF调度运行。

询问用户得知,用户提交时并未指定 -H 参数。

首先查看任务的历史信息,运行命令 bhist -l jobid,从输出信息中可以看到任务在初始化时失败。

LSF服务进程是以 root 身份运行的,任务初始化过程中最重要的一步就是从 root 身份切换到用户身份。因此排查的重点就是计算节点上的帐号系统是否正常,比如与帐号系统的通讯、系统参数设置如nsswitch.conf, resolve.conf, network等。

经过排查发现计算节点重启后自动启动了IPv6地址,导致与帐号系统连接出现错误。

禁止IPv6地址以后,恢复正常。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值