HPC 集群计算类型的注意事项

HPC 集群计算类型的注意事项

HPC 工作负载在 CPU ,内存,网络和存储资源需求方面有不同的要求。

您可以从以下内容开始:

  • 核心计数
  • 每个核心的内存
  • 网络带宽和等待时间
  • 处理器时钟速度

目标是选取返回最佳性价比的计算配置。 HPC 工作负载可以与单个核心作业一样简单,也可以与需要数百到数千个核心的作业一样复杂。 HPC 聚集了计算能力 (集群) ,可以提供更高的性能并解决大问题。

大多数 HPC 工作负载都低于 1000 个核心范围。 有些工作负载需要大量核心,直至 (包括) 10k-50k。 HPC 工作负载的执行时间可能很简单,仅持续几秒,也可能很复杂,需要几天时间。

例如, EDA (电子设计模拟) 工作负载具有组件级别的模拟作业,这些作业每天需要运行数百万个此类作业,但每个作业需要单个核心和大约 10 秒。 其他如光学近距离校正可能需要多个小时甚至几天,具体取决于芯片的大小和 HPC 集群的大小。

通常, HPC 集群包含一组虚拟机,并使用该集群来运行多个工作负载。 这一切都取决于工作负载资源需求和持续时间。

为了解决此范围的特征, IBM Cloud® 以不同方式提供各种 VPC 虚拟机 (VM) 配置:

  • 均衡配置,可提供每个核心的平均 4 GB 内存,并且在网络带宽中的范围为 4-64 Gbps
  • 计算密集型配置,可提供每个核心的 2 GB内存和 4-80 Gbps 网络
  • 内存密集型配置,可提供 8-每个核心 28 GB 内存和 2-80 Gbps 网络

对于所有配置,每个虚拟机的核心计数范围为 2-128。 有一种特殊的超高内存虚拟机类型,可能适用于每个核心需要更多内存的工作负载。 此类型最多可以达到 200 个核心,每个核心可高达 28 GB。

单个 NIC 上的网络带宽可以达到最大 16 Gbps。 如果需要更高的带宽,那么可能需要更多高达 80 Gbps 的 NIC 配置。 在这些情况下,需要为虚拟机配置 5 个 NIC。

缺省情况下,将在 IBM Cloud 虚拟机上启用超线程技术,因此每个物理核心都将获得 2 vCPUs 。 但这很容易被禁用。

请注意:大多数 HPC 应用程序的性能最佳,每个物理核心有一个进程或线程。

对于可以适合单个虚拟机上的通信密集型工作负载,最好选择最佳匹配项,最多可使用 128 个核心虚拟机实例,而不是在多个虚拟机实例之间拆分具有较小核心计数的工作负载。 这使进程能够利用通过单个虚拟机上的共享内存进行的更快通信,而不是通过以太网网络跨多个虚拟机进行的通信。

从角度来看,在同一虚拟机上运行的两个进程可能能够以微秒 (例如, 0.3 微秒) 的一小部分进行通信,而在两个虚拟机实例中,可能需要 30 微秒以上的时间。 通过单个虚拟机中的共享内存时,通信速度提高 100 倍。

非常经济有效的配置是 cx2-128x256,它允许每个核心 128 个核心和 2 GB 内存。 这可以涵盖广泛的 MPI 工作负载。

请注意:可以设置可扩展的 MPI 作业,这些作业需要配置为最多 80 Gbps 的多个虚拟机,但这需要多个 NIC ,并且可能不需要这些 NIC。 建议选择一个配置,通过单个 NIC 为每个核心提供最佳网络带宽。 bx2-16x64 可能是 MPI 基准测试的良好起点。

特定工作负载的基准评测

电子设计自动化 (EDA)

IBM Systems 和 IBM Research 在此行业领域开展工作,并已成功将 IBM Cloud 用于此类工作负载。 下图显示了最多 30 K 个核心的刻度测试。 为了展示如何将云区域用作单个数据中心,我们构建了一个大型 HPC 集群,用于聚集三个 IBM Cloud 位置的资源。 安装还将 IBM Spectrum Scale 用作基于临时的高性能文件系统以及 IBM Spectrum LSF 用于 HPC 集群配置。 我们已将 BX2-48x192 用于 IBM Spectrum LSF 工作程序节点,并将 MX2d-16x128 用于 IBM Spectrum Scale下的存储节点。

缩放

天气 (WRF 模型)

IBM Cloud 显示线性性能,性能良好,可扩展为数千个核心。 用于此基准的虚拟机配置为 bx2-16x64。 WRF 模型对网络等待时间不敏感,因为它将许多变量打包到每条消息中,从而产生相当大的消息,而没有多少小的消息。

在这里插入图片描述

红线表示具有 InfiniBand HDR 的 HPC 环境,提供最高带宽,最短等待时间,并且是此类工作负载的最佳配置。 绿色线条显示 IBM Cloud 以及用于基准测试的 Lon2 数据中心。 蓝线是 Summit 超级计算机。 总之,具有类似于 WRF 模型的特征的任何工作负载都应该使用 IBM Cloud进行扩展。 如您所见, IBM Cloud 显示了针对最先进的 HPC 系统的合理性能。

DoE (能源部) 基准评测

SNAP 和 Quicksilver 是 DoE 用于对特定商品技术系统进行基准测试和决策的两个应用程序。

下图显示了 IBM Cloud 如何与最先进的 HPC 系统进行比较的结果。

在 IBM Cloud上,基准程序使用了两种不同的配置:

  • bx2-8x32
  • bx2-16x64

如您所见, SNAP 结果显示 bx2-8x32 提供了更高的性能,因为每个核心的有效网络带宽比率更高; 其中 Quicksilver 与 bx2-16x64 表现良好,因为它具有中等的通信需求,并且大多是在全局域中跟踪粒子运动的近邻节点。

在这里插入图片描述
在这里插入图片描述

尽管缩放效果不如天气模型,但 IBM Cloud 可以使用线性曲线合理缩放多达数千个核心。

虚拟机用例

IBM Cloud 的虚拟机概要文件类型选项取决于有关核心,内存和网络需求的工作负载详细信息。

单节点虚拟机用例

这应该是第一次评估,因为它可以提供在 IBM Cloud上运行此类作业的最佳价格和性能。

您可以从以下一组虚拟机概要文件中进行选择:

  • CX2-16x32 到 CX2-128x256
  • BX2-16x64 到 BX2-128x512
  • MX2-16x128 到 MX2-128x1024

根据每个核心所需的内存,您可以选择 MX2 配置,该配置在 MX2-128x1024 概要文件上最多支持 1 TB。

如果每个核心所需的内存低于 2 GB ,那么相应的 CX2 概要文件可能会为您提供最佳的价格和性能。 如果工作负载可以在单个虚拟机上运行,那么与共享内存进行更快通信的优点有助于提高性能。

此类工作负载的一些示例:

  • 局部地区天气预报,分辨率不高,模型大但规模不大
  • OpenFOAM 计算流体动力学, 2 百万到 1000 万个网格单元之间问题的大小
  • 电子设计自动化 (EDA) 中的设计规则检查 (DRC) 作为芯片设计的一部分
  • EDA 单组件模拟和验证作业

使用多个虚拟机向外扩展用例

这是第二类工作负载,其中要求具有多个要执行的虚拟机。 甚至对于此类别,根据网络带宽和等待时间需求,大量 HPC 工作负载将在 IBM Cloud上扩展。

在某些情况下,可能需要对应用程序代码进行小型更新以将其调整好,以便在类似云的环境中运行,并且这些更改并非特定于 IBM Cloud ,而是希望向任何云提供者分类群发。

IBM 具有深厚的 HPC 专业知识,可提供特定建议,帮助您获得 HPC 云环境的最佳性价比。

IBM Cloud 已在以下示例中成功:

  • EDA 中的光学近似值校正 (OPC)
  • EDA 中的全芯片集成电路验证器 (ICV)
  • 任何 Hadoop 映射/减少或 Spark 工作负载
  • 无法在单个虚拟机上运行的 MPI 工作负载

此类工作负载的建议是从 BX2-16x64 开始,因为它在迄今为止的测试中提供了最佳性能。 根据您的结果,您可以深入了解可能更适合特定工作负载的替代选项。 某些工作负载可能具有网络等待时间敏感性,并且 IBM Cloud 配置可能没有前景; 但是,即使在这些情况下,请与产品所有者和销售团队进行互动,以便 HPC 专家可以评估您的特定需求并提供帮助。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您好!对于搭建 Linux HPC(高性能计算)集群,以下是一般的步骤: 1. 硬件准备: - 购买适当的服务器和网络设备。 - 确保服务器具有足够的计算能力和存储空间。 2. 操作系统选择: - 选择适合 HPC 集群的 Linux 发行版,如 CentOS、Ubuntu Server 或者 Red Hat Enterprise Linux(RHEL)等。 3. 网络架构规划: - 设计网络拓扑结构,包括子网划分、IP 地址分配等。 - 设置网络交换机和路由器,确保良好的网络连接。 4. 安装和配置操作系统: - 在每个服务器上安装选择的 Linux 发行版。 - 配置网络设置和基本系统设置,如主机名、域名解析等。 5. 文件系统和共享存储: - 选择合适的文件系统,如 Lustre、GPFS 等。 - 配置共享存储,确保所有节点对共享文件系统的访问。 6. 软件安装: - 安装并配置 HPC 软件栈,如 MPI(消息传输接口)、OpenMP(开放多处理)等。 - 安装作业调度器,如 Slurm、PBS(Portable Batch System)等。 7. 集群管理工具: - 配置集群管理工具,如 Ganglia、Nagios 等,以监控集群的性能和健康状态。 8. 测试与优化: - 运行一些基准测试来评估集群的性能。 - 根据测试结果进行调优,如调整网络设置、优化作业调度策略等。 以上是一般的搭建步骤,具体的搭建过程可能会因集群规模、硬件和软件选择等而有所不同。希望能对您有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值