Centos 6/7安装Torque(单节点)**
1、 简介
PBS(Portable Batch System)最初由NASA的Ames研究中心开发,主要为了提供一个能满足异构计算网络需要的软件包单节点,用于灵活的批处理,特别是满足高性能计算的需要,如集群系统、超级计算机和大规模并行系统。
PBS是功能最为齐全, 历史最悠久, 支持最广泛的本地集群调度器之一。PBS的主要特点有:代码开放,免费获取;支持批处理、交互式作业和串行、多种并行作业,如MPI、PVM、HPF、MPL。
PBS的目前包括:openPBS, PBS Pro和Torque三个主要分支.
- OpenPBS:是最早的PBS系统, 目前已经没有太多后续开发
- PBS pro:是PBS的商业版本, 功能最为丰富
- Torque:是Clustering公司接过了OpenPBS, 并给与后续支持的一个开源版本
应用PBS提交任务则会形成任务队列,依次执行,有效分配资源,避免资源竞争。否则CPU时间片会轮流分配给各个人的任务,从而影响所有人的正常作业。本文主要说明Torque的安装与配置,通过编译源代码的方式安装torque由于整个torque都被安装在一台计算机上,所以上述pbs_server、pbs_mom和pbs_sched都会被安装在一起。
Torque主要由三个主要部件组成:
- PBS服务守护进程: pbs_server 负责接收作业提交,位于服务节点
- PBS调度守护进程: pbs_sched 负责调度作业,位于服务节点
- PBS MOM守护进程: pbs_mom 负责监控本机并执行作业,位于所有计算节点
2、软件获取
版本 | 下载网址 |
---|---|
torque-6.1.1.1 | http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.1.1.tar.gz |
torque-6.1.2 | http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.2.tar.gz |
官网下载 | http://www.adaptivecomputing.com/support/download-center/torque-download |
注:不同版本的安装和配置类似,本文以torque-6.1.1.1为例。
3、系统信息的查询
3.1 计算机核数查询
lscpu: 此命令用来显示cpu的相关信息(lscpu从sysfs和/proc/cpuinfo收集cpu体系结构信息)
主要信息:
CArchitecture: #架构PU(s)
Thread(s) per core: #每个核心线程
Core(s) per socket: #每个CPU物理核数
CPU socket(s): #cpu插槽数
Vendor ID: #cpu厂商ID
CPU family: #cpu系列
Model: #型号
Stepping: #步进
CPU MHz: #cpu主频
Virtualization: #cpu支持的虚拟化技术
注:总的Threads数量(CPU逻辑核数) = 2(Sockets) × 4(Core(s)) × 2(Threads) = 16(CPU(s)).
[root@master ~]# lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 16
On-line CPU(s) list: 0-15
Thread(s) per core: 2
Core(s) per socket: 4
Socket(s): 2
NUMA node(s): 2
Vendor ID: GenuineIntel
CPU family: 6
Model: 44
Stepping: 2
CPU MHz: 2401.000
BogoMIPS: 4799.88
Virtualization: VT-x
L1d cache: 32K
L1i cache: 32K
L2 cache: 256K
L3 cache: 12288K
NUMA node0 CPU(s): 0-3,8-11
NUMA node1 CPU(s