Linux|SGE(集群任务管理系统)常用操作命令

qhost:显示各节点信息表
参数
  • -j:显示每个节点上运行的作业信息
  • -q:显示每个节点接受的队列
结果(这些还需要再确定一下)
  • HOSTNAME:节点名
  • ARCH:支持处理器架构
  • NCPU:已经利用的 CPU 核心数
  • NSOC
  • NCOR:可利用的核心总数
  • NTHR:线程数
  • LOAD:当前负载,负载和核心数一致
  • MEMTOT:总内存
  • MEMUSE:当前使用内存
  • SWAPTO:总 SWAP 内存
  • SWAPUS:当前使用的 SWAP 内存
qstat:显示作业的状态
  • -F:显示每个队列的摘要信息以及作业列表
  • -j [job_id]:显示作业编号为 job_id 的作业的状态
  • -U [login_id]:显示 login_id 可以访问的那些队列的正在运行和等待作业的列表
  • -u [login_id]:显示 login_id 正在运行和等待的作业的列表
qsub job.sh:提交作业 job.sh

job.sh 文件内容样例:

#!/bin/bash
python -m task.test > log 2>&1
  • -N 作业名称;在使用 qstat 检查作业状态时显示
  • -q 设置队列
  • -V 将所有环境变量传递给作业
  • -v var[=value] 将自定义的环境变量 var[=value] 传递给作业
  • -b 允许命令是二进制文件而不是脚本
  • -w 验证选项并在出现错误时终止
  • -l h_vmem=size 指定所需的最大内存量(因为这是每个处理器的内存,所以如果使用 2 个处理器,则总内存需要乘 2)
  • -l h_rt=hh:mm:ss 指定最长运行时间
  • -l s_rt=hh:mm:ss 指定软运行时间限制(需同时设置 s_rth_rt
  • -pe smp
  • -cwd:在当前工作目录中运行
  • -wd:将此作业的工作目录设置为
  • -o <output_logfile>:设置输出日志文件的名称
  • -e <error_logfile>:设置错误日志文件的名称
  • -m:作业结束或中止时将发送电子邮件
  • -P:设置作业的项目
  • -M:要发送电子邮件的电子邮件地址
  • -t:提交带有起始索引的作业数组
qdel [job_id]:取消作业编号为 job_id 的作业
  • -f:强制取消
参考资料
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长行

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值