XXX集群日志错误信息总结

本文总结了在集群执行任务时遇到的各种错误状态,包括0、19、26、27、28、30和100等,详细解析了exit_status及其对应的信号意义,如SIGABRT、SIGKILL和SIGSEGV。分析了不同错误代码的出现频率,如100(可能因资源过度消耗或节点问题导致)和137(可能因作业超时或内存限制)。并指出部分错误代码对应的failed任务情况。
摘要由CSDN通过智能技术生成

详情参考:http://arc.liv.ac.uk/SGE/htmlman/htmlman5/sge_status.html

出现的错误:

0:正常执行并退出

19:在输出exit_status之前退出,没有正确记录日志

26:打开标准输入输出文件出错

27:找不到指定的shell

28:无法修改当前目录到目标工作目录

30:程序本身返回错误,执行了但是返回100错误,可能进行了重调度

100:执行了但是被信号杀死,可能的原因包括资源过度消耗、进程死掉或者节点坏掉


总任务数:100067,其中非0数量为3599

0:96468:0.9640

19:2:0.000001

26:715:0.0071

27:3:0.000001

28:342:0.0034

30:1:0.000001

100:2536:0.0253


exit_status:如果程序内部正常退出(包括程序内部遇到的错误),则exit_status就是最后一条命令执行的返回码。如果程序受到外部干预(比如收到系统发送的signal 9,即kill的信号&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值