openlava图形化监控工具openlavaMonitor

本文介绍了开源免费的openlava工作负载调度器,并重点讲解了一款名为openlavaMonitor的图形化监控工具,该工具用于辅助openlava的数据采集和前台监控,包括JOB、JOBS、HOSTS和QUEUES四个页面,提供资源使用情况的实时展示。文章还提供了安装配置的详细步骤,鼓励用户根据自身需求对其进行改造。
摘要由CSDN通过智能技术生成

OpenLava是100%免费、开源、兼容IBM® Spectrum LSFTM的工作负载调度器,支持各种高性能计算和分析应用,在各大IC公司被广泛引用。

openlava开源免费,兼容LSF,是IC公司(尤其是中小型IC公司)的福音。但是由于种种原因,开源团队不再进行开发工作,且工具缺少配套的job/resource监控类工具,所以并不易用。以往的工作中,根据openlava使用中的实际需求,我开发过一些openlava辅助类工具,以帮助openlava的工具配置,数据采集,前台监控。出于资源共享的目的,我把数据采集和前台监控的功能采用标准python工具的格式进行了重新开发,命名为openlavaMonitor,开源到了github上,以方便大家下载使用 (地址https://github.com/liyanqing1987/openlavaMonitor)。

下面对工具做一下简单介绍,帮助大家了解。

 

1. 工具介绍

工具的使用分为两部分: 后台数据采集,前台数据展示。这一部分主要讲一下工具的前台展示部分。

工具为图形界面,包含4个页面,分别展示不同的内容。

1.1 第一个页面为JOB页,主要展示job相关信息。

在Job输入框输入job id,点击Check按钮,可以显示出job的关键信息,job的详细信息,job的memory使用量变化曲线。

其中job的memory使用量变化曲线十分有用,可以用来判断job的资源使用情况,用来debug job crash的原因(很多job crash都跟memory使用过量有关)。

OpenLava是一个开放源代码的高性能计算集群管理软件。它是LSF(Load Sharing Facility)的开源替代品,提供了一种稳定、易用、灵活的集群管理解决方案,以满足计算密集型、数据密集型和高性能计算应用的需求。 OpenLava 4.0作为OpenLava软件的新版本,进一步扩展了OpenLava的功能和性能。 OpenLava 4.0中增加了许多新功能,如动态节点管理、GPU支持、统一认证、任务调度、监视和管理功能。开发者进一步提高了系统的可靠性、安全性和易用性,使其更加适合用于企业级应用。 动态节点管理是OpenLava 4.0中的一个非常重要的新功能。通过这个功能,用户可以在集群中动态地添加、删除或重新分配节点。这大大提高了集群的可扩展性和资源利用率。 GPU支持也是OpenLava 4.0的关键功能。如果需要进行GPU计算的任务,现在可以选择使用GPU节点,从而获得更快的计算速度。 统一认证可以将OpenLava 4.0与企业的用户管理系统集成在一起,从而实现单点登录和一致的用户管理。任务调度也得到了改进,现在可以更加灵活地管理任务的细节和优先级。监视和管理功能使管理员可以更方便地了解集群的状态,并根据需要执行操作,如重启节点或KILL任务。 总之,OpenLava 4.0是一个性能强大、功能丰富的集群管理软件。它通过实现动态节点管理、GPU支持、统一认证、任务调度和监视、管理功能等多项新功能,进一步提高了集群的可靠性、灵活性和易用性。因此,它是高性能计算应用的一种理想选择。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值