在上一篇中我们简要介绍了 PBS 作业管理系统,下面我们将介绍 LSF 作业管理系统。
简介
LSF (Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。
常用命令
- bqueues:查看计算队列
- bhosts:查看计算节点列表
- lsload:查看负载
- bsub:提交作业
- bjobs:查看作业状态
- bkill:终止作业
- bpeek:查看作业的标准输出
- bhist:作业历史信息
作业提交bsub
bsub调用方法
可以通过以下三种方法使用 bsub 来提交作业:
- 直接在命令行中输入完整参数:
- 进入 bsub 环境交互提交:
- 编写作业提交脚本供 bsub 处理。
直接输入完整参数
可以直接在 bsub 的命令行中输入完整的参数来提交一个作业,比如:
$ bsub -n 4 -q example-queue -o example.out ./example "-in