背景:新添加了一批机器,需要放到新的队列(queue)中,并尝试增加一个group
1.将机器加入资源池中
先将机器加到资源池:
Begin Host
HOST_NAME MXJ DISPATCH_WINDOW AFFINITY
default ! () (Y)
b10204 ! () (Y)
End Host
也可以将多个机器放到一个组里,现在创建一个IT的组:
Begin HostGroup
GROUP_NAME GROUP_MEMBER #GROUP_ADMIN # Key words
IT ( b10204 )
End HostGroup
如果有多个机器,也可以这样写:
IT ( b10[201-208] )
机器加入资源池完成
2.将新机器加入新队列
在LSF安装目录/conf/lsbatch/*/configdir/lsb.queues文件中添加如下内容
Begin Queue
QUEUE_NAME = IT
DESCRIPTION = dedicated queue for vpu team
USERS = taizuo01 alatia01
PRIORITY = 30
CORELIMIT = 0
JOB_CONTROLS = SUSPEND[brequeue $LSB_JOBID]
HOSTS = b10204 (新加的机器,也可以使用机器组代替,例如直接写IT)
INTERACTIVE = Y
FAIRSHARE = USER_SHARES[[TOP,100]]
# RES_REQ = select[ut<0.99] order[-mem]
RES_REQ = select[type==any] order[slots:-mem]
# #JOB_STARTER = /*/2.0/prod/sys/lsf_job_starter
REQUEUE_EXIT_VALUES = 199 EXCLUDE(200)
TMP = 500
NEW_JOB_SCHED_DELAY = 0
End Queue
3.给用户定义提交任务时的群组(group)
编辑/*/conf/lsbatch/shenzhen/configdir/lsb.users
Begin UserGroup
GROUP_NAME GROUP_MEMBER # Key words
test (test ) ([default,1])
End UserGroup
4.使配置生效
使用lsf管理员账号执行badmin reconfig,如果有报错,请根据报错修改相对应的文件
5.验证
执行bqueues命令即可看到添加的群组在列表中