作业调度系统PBS(Torque)的设置

1、修改/var/spool/torque/server_priv/目录下的nodes文件

Node1 np=16 gpus=4
Node2 np=16 gpus=4
...

其中Node1为计算节点名字,np为逻辑核数,gpus为显卡数
该文件给出了计算集群的最大可用资源

2、 重新启动pbs

\#service pbs_mon restart
\#service pbs_server restart
\#service pbs_sched restart

注意要按照顺序重启服务

3、 qmgr 是Torque用户对队列进行管理的交互界面

在root账户下进入qmgr

\#qmgr
Qmgr:list queue QueueName  //查看队列属性

Queue QueueName
queue_type = Execution
max_user_queuable = 100
total_jobs = 0
state_count = Transit:0 Queued:4 Held:0 Waiting:0 Running:1 Exiting:0 Complete:0
resources_max.ncpus = 12
resources_default.ncpus = 12
resources_default.nodes = 1
resources_default.walltime = 01:00:00
mtime = Tue Jan 30 16:14:38 2018
resources_assigned.ncpus = 4
resources_assigned.nodect = 1
max_user_run = 1
enabled = True
started = True

如要启用队列Qmgr:set queue QueueName enabled=True

相应的设置项在PBS命令相关中给出

max_user_queuable : 队列中一个用户能提交的最大作业数
max_user_run : 队列中一个用户同时运行的作业数
resources_max.ncpus :最大可用逻辑核数
total_jobs : 当前提交的作业数

如果要求一次执行一个任务,该任务占用12个核,其余任务需要排队,则设置max_user_run=1.然后在作业提交脚本.pbs中 -np 12

qmgr不需要重新启动pbs服务

4、如何将pbs_mom, pbs_server 和 pbs_sched ,并添加为系统服务,设置为开机启动

cd /usr/local/src/torque-2.5.12/contrib/init.d/
cp pbs_mom pbs_server pbs_sched /etc/init.d/
chkconfig --add pbs_mom
chkconfig --add pbs_server
chkconfig --add pbs_sched

转载于:https://www.cnblogs.com/kaikaikai/p/8385811.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值