LSF实践专题(13):LSF集群中用户的简单分组和权限管理

本文介绍了如何在LSF集群中对用户进行分组,设置队列权限,以及管理不同用户之间的作业权限,包括群组管理员的角色。通过群组和管理员机制,实现了组织内部作业的管理和动态优先级控制。
摘要由CSDN通过智能技术生成

目录

用户的分组

为用户组设置队列权限

不同用户间的作业权限以及用户群组管理员

总结


用户的分组

在LSF的集群中,会有很多用户来提交作业,这些用户可能来自不同的部门,不同的产品团队,或者不同的组织结构。我们可以为这些用户设置队列的使用权限,也可以先把用户进行分组,然后以组为单位进行权限设置。

打开$LSF_ENVDIR/lsbatch/<clustername>/configdir/lsb.users,进行以下配置,就可以建立一个新的用户群组,ug1,并指定有哪些用户属于这个用户群组。

图片

如图所示,GROUP_NAME用来指定群组名称,GROUP_MEMBER用于指定有哪些用户隶属于该群组。第一行表示创建群组ug1,所属用户包括 tadmin1, tadmin2,而第二行表示创建群组ug2,而ug2的所属用户包括所有ug1的用户以及tlimit1。这种配置方法对于层级有覆盖的组织结构会非常方便,比如“研发1组”和“研发2组”都属于“研发组”。

配置好之后,重启mbd就会将配置应用到集群,通过 bugroup 命令可以查看配置效果:

图片

图中ug1/表示这是一个用户群组,我们可以用bugroup -r将子群组展开到用户级别,如图:

图片

为用户组设置队列权限

之前讨论队列的fairshare时曾经提到过在队列中设置有哪些用户可以向这个队列提交作业,这个设置同样可以应用到用户群组级别。

图片

如图所示,我们可以将用户或者群组配置到队列的USERS 中,如果配置了群组,那么该群组下所有的用户都可以向这个队列提交作业。

不同用户间的作业权限以及用户群组管理员

在LSF集群中,除了集群管理员以外,普通用户是不可以操作和删除其他用户作业的,但是如果设立了群组,我们可以为每一个群组设置针对该群组的管理人员。

图片

如图所示,GROUP_ADMIN 可以用来给每个群组设置管理员,这个管理员只能作用于指定的用户群组,同时,这个管理员可以是这个群组的成员(GROUP_MEMBER)之一,也可以不是,如果不想为某个群组指定管理员,可以直接配置横线 “-”, 表示没有群组管理员。

图片

那么作为群组管理员,有什么不同的权限呢?

对于普通用户来说,可以通过bjobs默认只会列出自己提交的作业,用bjobs -u user可以列出指定用户提交的作业, 也可以用bjobs -u all列出所有用户的作业,或者指定usergroup的名字,列出所有属于该群组的用户的作业。

图片

用户可以对自己的作业进行一些管理操作,比如暂停、恢复或者终止(bstop、bresume、bkill),但是作为普通用户,却不可以操作其他用户的作业,这是一个很容易理解的设定,毕竟我们不希望任何一个人都可以随意操作自己的作业。

图片

如上图所示,用户tlimit1可以用指定用户的方式看到用户tadmin2的作业,但是他无法对tadmin2的作业进行操作。

但是有些场景下,还是需要有一些管理者可以对某些用户的作业进行操作,比如部门领导想要管理自己部门下成员提交的一些作业。这种情况下要怎么做呢?如果将这些管理者设置为集群管理员,显然可以实现这个需求,但是给予的权限又稍微有些大,这个时候我们就可以引入这个群组管理员的概念。

作为某个用户群组的管理员,可以对该群组所属用户提交的作业进行各种管理操作,但是对于群组以外用户提交的作业,则不能进行操作。

根据我们之前设定的,用户tadmin1和tadmin2都隶属于群组ug1,而tadmin1是该群组的管理员:

图片

因此用户tadmin1可以对同样隶属于ug1的tadmin2提交的作业进行操作, 但是用户tlimit1不属于ug1,因此tadmin1不能对用户tlimit1提交的作业进行操作管理:

图片

接下来我们通过群组管理员tadmin1将用户tadmin2的作业104清除掉:

图片

通过bjobs -l查看刚刚被杀掉的作业,可以看到作业是被root用户或者管理员杀掉的信息:

Completed <exit>; TERM_ADMIN: job killed by root or an administrator.

图片

总结

通过以上介绍的内容,我们可以根据实际的组织管理需要,对用户进行群组划分,并根据需要,设立一些群组管理员来实现群组内部作业的一些简单管理。同时,用户群组还可以与之前介绍的fairshare结合实现更加进一步的动态优先级管理,我们以后再慢慢一起讨论。

欢迎关注下方微信公众号【HPC常青园】,共同交流HPC集群管理经验和最佳实践。如果您有关于HPC集群的具体需求,欢迎邮件沟通交流:hpc@ivyent.cn。

HPC常青园

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: LSF(Load Sharing Facility)是一种用于资源管理和作业调度的软件工具,其LSF license调度是指对LSF软件的许可证的管理和调度。 在使用LSF软件时,用户需要获得相应的许可证才能正常使用软件的全部功能。而LSF license调度就是对这些许可证的分配和调度,以确保每个用户都能够按照自己的需求使用软件。 LSF license调度通常涉及以下几个方面: 1.许可证分配:LSF管理员会根据用户的需求和优先级,将可用的许可证分配给不同的用户。通常将许可证分配给具有高优先级或需求的用户,以确保他们能够在需要时优先使用软件。 2.许可证回收:当一些用户不再需要使用LSF软件时,拥有许可证的管理员可以及时收回许可证,以便重新分配给其他用户。这样可以最大限度地提高许可证的利用率和效率。 3.许可证管理:LSF管理员还需要定期监控和管理许可证的使用情况,确保许可证的数量和使用情况与实际需求相符。如果发现许可证不足或者存在滥用的情况,管理员需要及时采取相应的措施。 总之,LSF license调度是对LSF许可证进行合理分配和管理的过程,旨在最大程度地满足用户的需求,提高许可证的利用效率,确保软件系统的正常运行。 ### 回答2: LSF(Load Sharing Facility)是一个用于集群计算的作业调度和管理系统,可以帮助高性能计算(HPC)环境下的任务有效地分配和使用资源。在LSF,license调度是指对软件许可证资源的优化调度和管理。 在一个HPC环境,常常需要使用各种不同的软件工具和库,这些工具和库通常需要相应的许可证才能合法使用。而软件许可证往往是有限的,所以对许可证资源进行调度是非常重要的。 LSF通过对许可证的分配和释放进行智能调度,以最大程度地利用许可证资源并最小化等待时间。它根据作业的需求和许可证的可用性,动态地分配许可证给需要它们的作业,尽量避免许可证的过度分配或浪费。同时,当一个作业不再需要许可证时,LSF会将其释放,以便其他作业能够利用这些许可证资源。 LSF还可以通过许可证的限制和优先级设置,来确保重要的作业能够获得所需的许可证资源,而次要的作业则可能会被推迟或降低许可证的使用。这样可以确保关键任务的顺利执行,同时最大限度地提高整个集群的利用率。 总而言之,LSF的license调度功能是为了合理、高效地管理和调度许可证资源,以确保HPC环境的作业能够得到所需的许可证,并在最短的时间内完成任务。这样可以提高计算集群的利用率,提升工作效率和系统性能。 ### 回答3: LSF(Load Sharing Facility)是一种用于分布式计算环境的作业调度和资源管理软件。在LSF,license调度是指通过合理管理和分配软件许可证(license),以确保系统所有用户能够合理使用软件许可证资源。 LSF License调度的主要目标是实现最大化利用软件许可证资源,同时确保用户的需求得到满足。为了实现这一目标,LSF会根据用户的需求和系统的实际情况进行许可证资源的分配和调度。 LSF License调度的过程通常包括以下几个步骤: 1. 许可证资源的监控和管理:LSF会监控系统可用的许可证资源数量和使用情况,并对许可证资源进行管理。这包括许可证资源的获取、分配、释放和回收等操作。 2. 许可证资源的分配:根据用户提交的作业需求和当前系统的状况,LSF会决定如何分配许可证资源给不同的作业。通常,LSF会采用一定的算法和策略来进行许可证资源的分配,例如根据作业的优先级、作业的资源需求和系统的负载情况等。 3. 许可证资源的调度和冲突处理:由于许可证资源是有限的,可能会出现作业之间对许可证资源的竞争。LSF会根据系统的策略和规则来调度许可证资源的分配顺序,并解决因许可证资源冲突而导致的调度问题。 4. 许可证资源的回收和释放:当作业使用完许可证资源后,LSF会将这些许可证资源回收并释放给其他等待的作业使用。这样可以确保系统许可证资源的充分利用。 总之,LSF License调度是为了合理分配和管理系统的许可证资源,以实现最大化的资源利用和满足用户的需求。通过LSF License调度,可以提高系统的效率和资源利用效率,同时提升用户的使用体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ivyent

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值