资源分配
节点状态
(scontrol show node ..)
UNKNOWN 未知
ALLOCATED 已分配
DOWN 故障
IDLE 空闲
DRAIN 不再分配
COMPLETING 有作业完成,正在退出
NO_RESPOND 无响应
分区状态
UP/DOWN
作业状态
PENDING 排队 PD
RUNNING 运行 R
SUSPENDED 挂起 S
COMPLETED 成功结束 CD
FAILED 失败结束 F
CANCELLED 取消CA
TIMEOUT 超时 TO
NODE_FAILED 节点故障失败 NF
状态转换图
作业步状态
(squeue -s)
作业运行模式
三种:交互模式、批处理模式、分配模式
注意分配模式只是用户使用方式的区别,管理、调度、记账时同等对待
交互模式作业
一个作业(一次资源分配)包含一个作业步(一次任务加载)
运行中,任务的I/O信号被传递到终端,可通过I/O信号与任务进行交互
批处理模式作业
通过编写作业脚本提交作业,在输出文件中查看结果。
一个作业可以包含多个作业步