LSF新增资源池机器并配置队列和群组

本文介绍了如何在LSF集群环境下,将新机器添加到资源池,创建主机组,配置新队列,并设置用户组。详细步骤包括修改配置文件、指定主机、设置队列参数等,最后通过badmin reconfig使配置生效,并验证操作成功。
摘要由CSDN通过智能技术生成

背景:新添加了一批机器,需要放到新的队列(queue)中,并尝试增加一个group

1.将机器加入资源池中

        先将机器加到资源池:

Begin Host

HOST_NAME       MXJ     DISPATCH_WINDOW AFFINITY

default         !       ()              (Y)

b10204          !       ()              (Y)

End Host

        也可以将多个机器放到一个组里,现在创建一个IT的组:

Begin HostGroup

GROUP_NAME      GROUP_MEMBER      #GROUP_ADMIN # Key words

IT              (  b10204 )

End HostGroup

        如果有多个机器,也可以这样写:

                      IT              (  b10[201-208] )

        机器加入资源池完成

2.将新机器加入新队列

        在LSF安装目录/conf/lsbatch/*/configdir/lsb.queues文件中添加如下内容

Begin Queue

QUEUE_NAME              = IT

DESCRIPTION             = dedicated queue for vpu team

USERS                   = taizuo01 alatia01

PRIORITY                = 30

CORELIMIT               = 0

JOB_CONTROLS            = SUSPEND[brequeue $LSB_JOBID]

HOSTS                   =  b10204   (新加的机器,也可以使用机器组代替,例如直接写IT

INTERACTIVE             = Y

FAIRSHARE               = USER_SHARES[[TOP,100]]

# RES_REQ               = select[ut<0.99] order[-mem]

RES_REQ                 = select[type==any] order[slots:-mem]

# #JOB_STARTER             = /*/2.0/prod/sys/lsf_job_starter

REQUEUE_EXIT_VALUES     = 199 EXCLUDE(200)

TMP                     = 500

NEW_JOB_SCHED_DELAY     = 0

End Queue

3.给用户定义提交任务时的群组(group)

        编辑/*/conf/lsbatch/shenzhen/configdir/lsb.users

Begin UserGroup

GROUP_NAME    GROUP_MEMBER      # Key words

test    (test ) ([default,1])

End UserGroup

4.使配置生效

        使用lsf管理员账号执行badmin reconfig,如果有报错,请根据报错修改相对应的文件

5.验证

        执行bqueues命令即可看到添加的群组在列表中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值