PBS是一个用于复杂和高性能计算环境(比如网格)的工作负载管理器和调度器。可以使用它来简化作业提交、跨多个平台集群分布工作负载,以及扩展到数百甚至数千个处理器。
今天试装了一下,简单记录了安装过程:
操作系统:Linux
安装软件:torque-2.3.1.tar.gz
下载地址:http://clusterresources.com/downloads/torque
安装步骤:
1。 在头结点(SERVER)上安装TORQUE
>tar -xzvf torque-2.3.1.tar.gz
>cd torque-2.3.1
>./configure
>make
>make install
2.设置path环境变量和TORQUECFG变量
>export PATH=$PATH:/usr/local/sbin
>export TORQUECFG=/var/spool/torque
3. 在计算节点上安装TORQUE
> make packages
>sh torque-package-mom-linux-x86_64.sh --install
>sh torque-package-clients-linux- x86_64.sh --install
4. 初始化/配置pbs_server
(1)初始化the configuration database
>pbs_server -t create (仅第一次需要参数-t create)
(2)激活调度接口
>qmgr -c "set server scheduling=true"
(3)创建队列并制定队列类型
>qmgr -c "create queue batch queue_type=execution"
(4)设置队列接收job提交
>qmgr -c "set queue batch started=true"
(5)启动一个已经入队列的job
>qmgr -c "set queue batch enabled=true"
(6)指出一个job将被放置在一个批次中
qmgr -c "set server default_queue=batch"
(7) 在server中指定计算节点
vi $TORQUECFG/server_priv/nodes
【server_priv/nodes】
node001 #主机名或ip,可以在/etc/hosts中指定,这样可以解 析其ip
node002
node003
【server_priv/nodes】
如果计算节点有多个cpu,用 np=<#CPUs>指定。
【server_priv/nodes】
node001 np=2
node002 np=4
【server_priv/nodes】
5.配置计算节点
(1)vi $(TORQUECFG)/mom_priv/config
【mom_priv/config】
XXX.XXX.XXX.XXX headnode
【mom_priv/config】
详见:http://clusterresources.com/torquedocs21/a.cmomconfig.shtml
(2)测试
重新启动服务:
> qterm
> pbs_server
查看节点状态
>pbsnodes –a
相关命令:
(1)启动
(2) 终止
qterm
(3)查看所有队列的配置信息
qstat -q
(4)查看server的配置
qmgr -c 'p s'
(5)查看任务状态
pbs_server
qstat