HPC集群平台搭建概念

本文深入探讨了HPC集群搭建的过程,包括可能遇到的问题、集群的构成、网络配置、软件组件的选择与安装,以及常用管理工具。重点讨论了InfiniBand网络在高吞吐量计算中的作用,同时提到了Rocks和xCAT作为集群管理工具的对比,以及操作系统选择如Red Hat和CentOS的影响。此外,还介绍了Lustre和PVFS等文件系统在不同规模集群的应用。
摘要由CSDN通过智能技术生成

  在本文之前,我建议先看完这篇文章:Linux高性能计算集群 – Beowulf集群  

一、搭建集群中可能会遇到的问题

1.集群设计/布局的一大难点就是网络,各家有各家的策略,一般围绕Beowulf变型。
2.软件的部署缺乏实操调试,也不能断定这样部署是否成功以及是否优越。
3.操作系统的选型以及安装系统、所需软件(包括集群管理工具、驱动软件、能耗监控软件等)的整个流程的手动/自动化部署。
4.每个提供硬件的对应公司几乎都推出他们自己的集群管理软件,浪潮好像没有,在HPC方面浪潮好像没有相应的开发社区,DELL和IBM这些大公司都有。
5.能耗的衡量,具体的优化方向和策略。

二、HPC概览

①总体构成

Outside Network: 外部网络
Master Node: 主节点
Compute Nodes: 计算节点
Storage: 存储器
Computational Network: 计算网络
Management Network: 管理网络

②大多数 HPCC 系统配有两个网络

  1. 基于TCP的管理网络
  2. 计算网络,可以是基于 TCP 或其它协议的,通常是 InfiniBand 或 Myrinet 10G 之 类的高速网络

③拓扑图

网上找的普遍认可的:
这里写图片描述
这里写图片描述


这个是自己根据实际情况“臆想”的:
这里写图片描述

④所需软件组件(按安装顺序):

1、对于安装系统:

  集群中的每个节点(HPCC 节点文章链接)、主节点、登录节点和计算节点都需要有操作系统。操作系统可以安装在节点的硬盘驱动器上,甚至可以安装在ramdisk 上,这有时被称为“无盘”或“无状态”节点。一般说来,主节点创建所谓的“映像”,然后将其发送到计算节点上进行安装(硬盘驱动器或 ramdisk 上)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值