job作业存放在哪里_工具 | 大型集群作业调度系统SGE

c756ca9ecad6f05359bf4dd080e0cdac.gif

以前在服务器(linux)上跑程序都是直接裸跑,没用过qsub。

qsub is a command used for submission to the SGE cluster.

一方面是"小作坊"可能并不需要搭建集群,另一方面,配置SGE貌似也不简单?

SGE

SGE(Sun Grid Engine),甲骨文(Oracle)公司的荣誉产品。中文名集群队列系统或者大型集群作业调度系统,不管怎么个叫法,其本质用于高性能计算(high-performance computing, HPC)集群,负责接收、调度和管理大量独立、并行或交互式作业的执行,其中就涉及到资源(如CPU、内存、磁盘空间等)的分配。

The Sun Grid Engine queuing system is useful when you have a lot of tasks to execute and want to distribute the tasks over a cluster of machines.

http://bioinformatics.mdc-berlin.de/intro2UnixandSGE/index.html

登录节点和计算节点

服务器集群一般由登录节点和计算节点组成。

登录节点用来执行日常的简单命令,不能执行大型的资源消耗型的任务,一是慢,二是容易崩溃...

资源消耗型的任务一般在登录节点通过 qsub 提交到计算节点执行。计算节点没有权限投递任务,只能执行。

qsub 投递任务

SGE接收到用户提交的任务后会将其储存至一个特定区域,然后将其调度至计算节点监控其运行,运行结束后返回执行结果。该过程会在后台自动执行(无需nohup)。

qsub -cwd -l vf=*G,p=n,h=node -q main.q test.sh

参数说明:

-cwd:在当前目录下执行任务,运行日志也会输出到当前目录,或用 -wd 指定输出目录。

-l:申请资源,包括内存、CPU、特定节点等。vf=*G设置执行程序预估的内存大小,应该稍微大于真实的内存,否则可能会导致节点跑挂;p=n用于设置所需的CPU数;h=node设置任务指定投递的节点名称。一般只设置vf即可!

-q:指定任务要投递到的队列名称。如果不指定的话,SGE会在用户可使用的队列中选择一个满足要求的队列( qstat-g c 可查看按内存排序的队列)。

test.sh:将要执行的脚本

例如,要提交 hello_word.sh 脚本,其中设置了唯一的一个命令是 echo"hello word!" ,提交执行:

qsub -cwd -l vf=1G -q all.q hello_word.sh

00016994a85271216cb12974fb51d072.png会提示job-ID(444824),使用 qstat 命令可查看进度(如果执行了 qstat 什么都没输出,就是执行完了),state列标识任务状态qw代表任务在排队等待执行r代表任务正在执行s代表任务暂时挂起dr代表任务所在的计算节点挂掉了...

执行完成后,会在当前路径下会生成 helloword.sh.e444824 和 helloword.sh.o444824 两个文件(可以用 -e-o 参数设定输出文件名)。前者存放标准错误输出(如果程序正常执行没有报错,就是空的), 后者存放标准输出,就是 test.sh 中命令的执行结果,即

hello word!

对于上示简单操作,直接提交命令的方式要比提交.sh脚本的方式更便捷:

echo "hello word\!" | qsub -cwd -l vf=1G -q all.q

但是,推荐脚本的方式提交!

已知job-ID,还可以查看特定任务的状态、删除任务等:

## 查看指定任务状态

qstat -j job-ID

## 查看某个用户的任务(不包括已经执行完成的任务)

qstat -u username

## 删除任务

qdel job-ID

## 挂起任务

qmod -s jobID

## 继续运行某个挂起的任务

qmod -us jobID

qhost 相关操作:

## 查看计算节点资源状况信息

qhost

qhost -j # 详细信息

## 列出某个用户在每个节点上的任务

qhost -u username

ee0c196237a9b067257808665b987be5.gif

工具系列·往期精彩

Docker | 终于有了自己的对象,呸,镜像!

软件推荐 | linux下载神器-axel

且用且珍惜!

762c2126a78ff960f5a449578ba64413.png

课程已经正式发布且更新完成!

1f884a4814ab5a905df8e9de4b9caae6.gif

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值