在OpenLava中管理并行作业

Blaunch,并行作业远程任务启动器

HPC环境本质上是复杂的,这对并行工作负载而言尤其如此。若能使MPI作业在工作负载管理器的控制下可靠且可预测地运行,将大大有助于缓解一系列潜在问题,并使HPC环境更具可靠性。

在理想环境中,启动和管理MPI任务的过程将在所有工作负载管理器和MPI实现中保持一致。在现实环境中,事情并不总是那么简单。好消息是,在OpenLava中 运行和管理并行作业就简单多了。

超越无密码SSH

大多数MPI的实现,需要使用无密码SSH作为其远程主机上任务的启动机制。这是一个很好的解决方案,但调度外的任务调度器绕过资源计费和控制机制,使它们更难管理。任何有经验的集群管理员都会告诉你,只要一个命令就可以结束、挂起或恢复并行作业,而不是编写自定义脚本来处理作业调用失败或运行错误后仍在各种群集主机上运行的顽固或孤立线程。

Blaunch简介

新的OpenLava Blaunch工具提供了一个能够替代SSH作为启动并行应用程序的便捷方法。通过在Blaunch下运行并行作业,任务在OpenLava远程执行服务(RES)的控制下运行。通过Blaunch监视和收集完整的作业进程资源使用情况,可以使用其他OpenLava命令(如bjobs -l)查看。此外,Blaunch工具还能传播信号,使得像bkill,bstop和bresume这样的Ope

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值