一,程序与文档下载
http://www.clusterresources.com/
二,Torque/Maui
Torque是个分布式的资源管理器,可以管理批处理任务和分布式计算节点上的资源。Torque是在openPBS基础上发展来的。
Torque自身的任务调度器比较简单,想用复杂的调度器可以使用Maui插件
三,MPI
Message Passing Interface定义了计算机间协作通讯和计算的标准,可以用于分布式计算和集群环境搭建。通常,会用Torque管理MPI的计算资源和批处理任务。
四, 编译安装Torque
1,configure参考参数如下
$./configure --enable-docs --enable-mom --enable-server --enable-clients --with-scp
--enable-mom, 打开计算节点功能
--enable-server, 打开pbs管理服务器节点功能
--enable-clients,打开连接pbs服务器的客户功能
mom/pbs server/client关系请参考管理员手册
2,$make clean; make
3,$sudo make install
在当前节点安装管理服务器,计算节点,客户端组件。管理服务器主要用于作业提交管理,通常会使用客户端连接管理服务器进行管理操作。计算节点是实际执行作业计算的节点。管理服务器节点既可以仅仅作为管理节点,也可以同时作为计算节点。
4,$make packages
制作计算节点的安装包,避免在每个计算节点编译Torque。将安装包scp到计算节点执行即可,这是个sh脚本加上压缩数据的安装包。只有mom安装包是计算节点必须的。如果要从计算节点提交作业,请一并安装clients组件。
五,编译安装Maui
1, Maui patch
Maui在一些平台会有编译错误,请使用这个patch
MPBSI.c:177: error: conflicting types for get_svrport
/usr/local/include/pbs_ifl.h:684: n