一款开源的Slurm Dashboard监控平台

本文介绍了开源的Slurm web监控平台,用于监控集群节点、作业、队列、QoS等,提供丰富的图表展示,包括机架图、拓扑图、甘特图等。系统支持多集群统一监控,已在大型集群中得到验证。主要功能包括作业监控、机架展示、作业分布、队列管理、QoS控制、资源预留以及用户权限管理。
摘要由CSDN通过智能技术生成

 SLURM (Simple Linux Utility for Resource Management)是一种可用于大型计算节点集群的高度可伸缩和容错的集群管理器和作业调度系统。

今天给大家介绍一款开源Slurm web监控平台,它主要用来监控集群的节点、作业、作业分布、队列、QoS,资源预留等等。该平台具有丰富的图示:集群机架图,节点拓扑图,队列使用情况甘特图等。并且支持多集群统一监控。

该系统已经在国外的大型集群中经过实践验证。

下面给大家介绍下这个开源系统的功能。

01

作业

作业页面包含:分配给作业的core核数占比,作业状态情况,核数在partition中的使用情况,核数在QoS中的分布情况等。

下方同时展示了作业列表,可查看单个作业详情。

作业详情:

02

Racks

所谓rack,就是服务器机架,通过页面来展示监控物理服务器节点位置和状态。通过不同的颜色来表示不同的资源繁忙状态。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值