mbatchd
在管理主机上运行的Master Batch守护进程。负责系统内工作的整体状态。接收作业提交和信息查询请求。管理队列中的作业。将作业分派到由mbschd确定的主机。
mbschd
管理批调度程序守护程序,运行在管理主机上。与mbatchd一起工作,由mbatchd启动。根据工作要求、策略和资源可用性做出调度决策并向mbatchd发送调度决策,mbatchd根据调度决策进行作业的分派,将调度决策发送到batchd。
sbatchd
运行在每一个主机上,包括管理主机,接收mbatchd运行任务的请求,并管理本地运行的任务,负责执行本地策略和维护主机上的作业状态。sbatchd会为每一个任务创建一个sbatchd的子进程,子进程运行在res的实例中,来创建每一个任务的执行环境,当任务完成之后子进程则退出。
res
远程执行服务器(res)在每个服务器主机上运行。接受远程执行请求,提供透明、安全的远程
作业和任务的执行。
lim
负载信息管理器(LIM)在每个服务器主机上运行。收集主机的负载和配置信息,转发给主机
在主主机上运行的LIM。报告lsload和lshosts显示的信息。静态索引在LIM启动时或cpu数量时上报
Master LIM
运行在每一个主机上,包括管理主机。从lims接收负载信息运行在集群内的主机上。将加载信息转发给mbatchd,后者将此信息转发给mbschd来支持调度决策。如果主LIM不可用,另一台主机上的LIM自动接管
ELIM
外部LIM (ELIM)是一个站点可定义的可执行文件,用于收集和跟踪自定义动态载荷指标。ELIM可以是shell脚本或编译后的二进制文件程序,它返回所定义的动态资源的值。ELIM的
可执行文件必须命名为elim,并位于LSF_SERVERDIR中。
pim
进程信息管理器(PIM)在每个服务器主机上运行。由LIM启动,它定期检查pim,如果死机则重新启动它。收集主机上运行的作业进程信息,如CPU、作业使用的内存,并将信息报告给sbatchd。