集群环境配置
配置集群,简单的说即设置一台电脑用作主控主机(qmaster),收集集群信息、分配任务、调节负载均衡等;设置多台电脑用作执行主机(execd),用作具体任务的执行。
操作系统
Centos6.2及以上, 64位操作系统.
注:下列的命令前面的“%”表示一般用户,“#”表示root。集群安装文件
在网站: http://gridscheduler.sourceforge.net/
标题“Download Grid Engine/Grid Scheduler”下
下载集群源文件: GE2011.11.tar.gz,并执行下列命令的操作:
% tar zvxf GE2011.11.tar.gz
% cd GE2011.11/source
% ./aimk -no-java -no-jni -no-secure -spool-classic -no-dump -only-depend
% ./scripts/zerodepend
% ./aimk -no-java -no-jni -no-secure -spool-classic -no-dump depend
% ./aimk -no-java -no-jni -no-secure -spool-classic -no-dump
% mkdir /opt/ge2011
% scripts/distinst -all -local –noexit
(最后一条命令将install_qmaster、install_execd等安装在$SGE_ROOT下面)
或者, 在该网站下载 “Grid Engine 2011.11 binary for x64 (now with the GUI installer)”直接得到了install_qmaster、install_execd这些可执行文件。
网络环境配置
TCP/UDP端口设置
集群需要两个没有用过的集群端口号,默认的为:
sge_qmaster 6444/tcp
sge_execd 6445/tcp
建议更改为其他未使用的端口号,如通过命令:
# vim /etc/services
打开Linux下端口号配置文件,将6444/6445端口号注释掉,换成如27100/27101
#sge_qmaster 6444/tcp # Grid Engine Qmaster Service
#sge_qmaster 6444/udp # Grid Engine Qmaster Service
#sge_execd 6445/tcp # Grid Engine