Microsoft HPC Pack 2016部署Comsol Multiphysics多物理场耦合并行计算以及超大规模仿真计算集群硬件配置推荐

并行计算(Parallel Computing)是指同时使用多个计算资源解决计算问题。并行 计算的主要目的是快速解决大型复杂的计算问题,或者节约成本——使用多台“廉价” 计算机取代昂贵的大型机,以下测试启动两个节点(win10),每个节点使用8个内核参与计算。管理节点即头节点系统为windows server 2019,COMSOL Multiphysics 安装版本为5.4

1 部署Windows并行环境

1.1准备工作

首先,集群中的每台机器应该能够相互通过网络相互访问,而在 Windows 中,缺省打开的防火墙将限制彼此之间的访问。建议如下图所示分别新建连接安全规则、入站规则、出站规则(名字任意,本例为comsol,免除身份验证ip段为192.168.0.1~192.168.0.255)

在所有的节点上执行以上操作,使得各节点之间可以相互连接。

 

1.2配置server 2019

首先需要为管理节点指定一个 IP 地址,本例:192.168.0.109

开始设定Active Directory,打开服务器管理器,点击添加角色,在添加角色向导对话框点击下一步,在服务器角色列表中选择Active Directory域服务:

 

点击下一步,阅读一下简介,然后点击下一步,点击安装。

安装完成如图点击部署后配置:

 

打开Active Directory域服务配置向导,选择添加新林,根域名:cluster.ultralab.com(可自定义):

 

点击下一步,林功能级别和域功能级别选择 Windows Server 2016,自动勾选域名系统(DNS)服务器和全局编录,自定义密码:

 

点击下一步,其他选项--NetBIOS域名:CLUSTER(自定义)

 

下一步,一般会提示无法创建该DNS服务器的委派,无需理会,安装完成后会提示即将注销重启计算机:

 

重启后即可使用Active Directory角色的服务,接着添加域用户。点击服务管理器--工具--Active Directory用户和计算机:

cluster.ultralab.com--Users右键,新建--用户:

 

如下图(用户名可自定义):

 

点击下一步,设置密码,如图设置:

 

下一步完成添加用户。为方便操作,可以给此用户赋予域管理员的权限。双击新建的用户(comsol):

 

点击隶属于标签,点击添加:

 

在选择组对话框中,点击高级按钮,在展开的对话框中,点击立即查找,在搜索

结果中找到Domain Admins

 

点击确定,继续点击确定,如下图列表所示,再点击确定关闭窗口

 

还需要把这个新增的用户添加到当前计算机中,点击控制面板--管理用户和账户

添加用户对话框中输入用户名:comsol,域:cluster.ultralab.com

 

下一步,如下图选管理员,下一步

 

如下图点击确定,将comsol添加到当前计算机的管理员帐号:

 

以上步骤完成了在server 2019上的Active Directory、用户帐号等设定。

 

1.3安装Microsoft HPC Pack 2016

安装向导中,选择:新建安装

 

选择通过创建头节点来新建一个HPC集群

 

安装规则测试完成无误后点击下一步开始向计算机中安装所需的数据库、服务等各种程序

 

1.4部署头节点(管理节点)

安装完成,打开集群管理器,首先点击配置网络,在网络配置向导对话框中选择

5.仅在企业网络上的所有节点:

依次点击下一步,最后点击配置。等候管理器完成网络的配置工作,然后点击完

成。

然后在集群管理器对话框中点击提供安装帐号,用户名:cluster.ultralab.com\comsol,设置密码:

 

接着在集群管理器中点击配置新节点的命名规则:

 

最后在集群管理器里面点击节点模板--新建

 

在新建节点模板向导中选择工作站节点和非托管服务器节点模板

依次点击下一步,最后点击创建。

至此完成 HPC 的安装和头节点的设定。

 

1.5部署计算节点

首先,头节点的IP地址作为计算节点的DNS。

然后修改计算机名:node01,隶属于-域为:cluster.ultralab.com

点击确定,输入域中的用户名 comsol 及相应的密码

点击确定,稍等片刻,可以看到欢迎对话框,点击确定,再点击确定,点击关闭,点击立即重启计算机。

重启后就要更换登录方式了,现在应该使用域用户的方式来登录。按照提示按下

键盘中的 Ctrl+Alt+Del,然后点击切换用户,在用户名中输入 comsol,输入正确的密

码,然后登录。

 

运行HPC pack安装目录 setup.exe。选择通过创建新的工作站节点或非托管服务器节点加入现有 HPC 群集

 

下一步,在下拉列表中选择头节点的名称,下一步,继续下一步,选择一个更新方法,点击下一步,然后点击安装。这个时候会将相关的数据库等程序安装在计算节点上。

安装完毕后回到头节点,在集群管理器中,点击添加节点,选择添加已经配置的工作站节点和非托管服务器节点。

 

点击下一步,再点击下一步,在选择新节点对话框中选择所要加入集群的节点,例如,NODE01

 

点击添加,点击完成。这时我们可以看到管理器开始执行正在添加节点的工作,它会向计算节点中添加一些必要的密钥、管理程序等,完成了集群的节点添加工作,我们就可以在这个集群上进行并行计算了。

 

2 COMSOL Multiphysics并行计算设置

启动COMSOL Multiphysics

调度程序选择HPCS 2008/2012/2016,其他根据需要自定义设置。

 

经测试:

测试1: 算例(瞬态,约58万自由度)测试,在多核(4核、6核、8核、16核、28核)测试结果看到,Comsol Multiphysics多物理场耦合,8核并行计算加速比最高,也是性价比最高,CPU核数再提升,性能提升幅度很低

测试2:算力(稳态,600万自由度)测试,8核还是最佳,单机计算时间过长,承受太重,建议用集群方式求解

以下是Comsol Multiphysics单机以及集群硬件配置方案

(1)基于单机架构多物理场耦合仿真计算硬件配置推荐
求解规模:小于300万自由度

NO

型号

主要配置

报价

备注

1

UltraLAB H380 14864-SAA

Intel 第9代高频处理器(8核@4.8Ghz)/64GB DDR4 3000/Quadro P620 2GB /960GB SSD+4TB SATA企业级/塔式(750W)/23寸图显

28000

高性价比

2

UltraLAB H380  150128-SAA

Intel 第10代高频处理器(10核@5.0Ghz)/128GB DDR4 3000/Quadro P620 2GB/960GB SSD+6TB SATA企业级/塔式(750W)/23寸图显

39000

小规模高速计算型

3

UltraLAB AX410 142384-SAB

Intel 第10代至尊处理器(18核@4.2Ghz)/192GB DDR4 3000/Quadro P1000 /1.9TB SSD +10TB SATA企业级/塔式(750W)/23寸图显

54500

小规模计算多任务型

4

UltraLAB EX630i  234192-SBA

2颗Xeon 金6226R处理器(32核@3.4Ghz)/192GB DDR4 2933/Quadro P620 /1.9TB SSD +6TB SATA企业级/塔式(750W)/23寸图显

58000

中等规模

5

UltraLAB EX630i  237192-SBA

2颗Xeon 金6242R处理器(40核@3.7Ghz)/192GB DDR4 2933/Quadro P620 /1.9TB SSD +6TB SATA企业级/塔式(750W)/23寸图显

79000

中等规模

6

UltraLAB EX630i  240320-SBA

2颗Xeon 金6246R处理器(32核@4.0Ghz)/320GB DDR4 2933/Quadro P620 /1.9TB SSD +8TB SATA企业级/塔式(750W)/23寸图显

97000

中大规格

7

UltraLAB Alpha730  443384-SCC

4颗Xeon 金6244处理器(共计32核@4.3Ghz) /384GB DDR4 2933/Quadro M4000/3.84TB SSD +10TB SATA企业级/双塔式(1600W冗余,静音级)/27寸-4K图显

179000

大规模高速计算型

高频+多核+高IO

8

UltraLAB Alpha730 441768-SCB

4颗Xeon 金6246处理器(48核@4.1Ghz)/768GB DDR4 2933 /Quadro P2000/3.84TB SSD +12TB SATA企业级/双塔式(1600W冗余,静音级)/27寸-4K图显

226000

大规模计算高速计算完美

高频+多核+高IO

9

UltraLAB Alpha730 443768-PCC

4颗Xeon 金6256处理器(48核@4.3Ghz)/768GB DDR4 2933 /RTX4000/4TB PcieSSD +20TB SATA企业级/双塔式(1600W冗余,静音级)/27寸-4K图显

275000

超大规模计算极致完美型

高频+多核+高IO

10

UltraLAB Alpha730 4391T-PDC

4颗Xeon 金6254处理器(72核@3.9Ghz)/1.5TB DDR4 2933 /RTX4000/1.9TB SSD/6TB PcieSSD /30TB SATA企业级/双塔式(1600W冗余,静音级)/27寸-4K图显

295000

多任务多用户团队超算型

(2)基于集群架构多物理场耦合仿真计算硬件配置推荐
推荐方案1 
集群型号:UltraLAB CT400 50C46-960
集群规模:5个计算节点(50核*4.6GHz ,960GB DDR4)
求解规模:150万~500万自由度
配置明细:

NO

货物名称

型号

数量

单价

小计

(一)硬件设备

1.1

 

计算服务器

10核@4.6Ghz+水冷散热/192GB DDR4 /QK420/960GB SSD企业级/4U机架式(750W)/56Gbps IB网卡/无显示器

5

37000

185000

1.2

主控服务器

2颗Xeon 银4214(24核@2.6GHz)/192GB /Quadro P1000/960GB+6.4TB高速缓存盘/42TB并行存储/4U机架式(1500w)/双56GB IB网卡/23寸图显

1

93500

93500

1.4

计算交换机

迈络思IB交换机12口@56Gbps

1

35000

35000

1.5

管理交换机

24口千兆电口

1

1100

1100

1.6

KVM切换器

8口,HDMI接口

1

2350

2350

1.7

机柜

42U,服务器级,插排,托盘

1

5500

5500

 

 

 

 

 

 

(二)集群系统

2.1

操作系统

 

 

 

 

2.2

作业调度软件

UltraLAB PSS作业调度软件(5节点)

1

50000

50000 

2.3

求解器

 

 

 

 

 

 

 

 

 

 

合计:¥372,450元


推荐方案2 
集群型号:UltraLAB CT400 100C47-2T
集群规模:10个计算节点(
100核*4.6GHz ,1.92TB DDR4
求解规模:
600万~1000万自由度
配置明细:

NO

货物名称

型号

数量

单价

小计

(一)硬件设备

1.1

计算节点

10核@4.6Ghz+水冷散热/192GB DDR4 /QK420/960GB SSD企业级/4U机架式(750W)/56Gbps IB网卡/无显示器

10

37000

370000

1.2

存储节点

2颗Xeon 银4214(24核@2.6GHz)/192GB /Quadro P1000/960GB+6.4TB高速缓存盘/42TB并行存储/4U机架式(1500w)/双56GB IB网卡/23寸图显

1

93500

93500

1.4

计算交换机

迈络思IB交换机12口@56Gbps

1

35000

35000

1.5

管理交换机

24口千兆电口

1

1100

1100

1.6

KVM切换器

16口,HDMI接口

1

4800

4800

1.7

机柜

42U,服务器级,插排,托盘

2

5500

11000

 

 

 

 

 

 

(二)集群系统

2.1

操作系统

 

 

 

 

2.2

作业调度软件

UltraLAB PSS作业调度软件(10节点)

 

1

100000

100000 

2.3

求解器

 

 

 

 

 

 

 

 

 

 

合计:¥615,400元


常见问题
1)为什么Comsol Multiphysics运行CPU使用率只能到4%
答:很多求解是单线程的,或求解过程的某个阶段,是单线程的,这是正常的

2)Comsol Multiphysics怎样选择CPU
答:不同求解器有不同的多核并行计算特点,具体情况具体分析,参考测试数据

3)Comsol Multiphysics运行为什么会内存不够
答:网格划分过细过大,造成数据计算规模大,超出内存容量,通过优化或简化模型可以降低计算量,少占用内存

4)Comsol Multiphysics求解速度为什么这么慢
答:可能原因CPU核数、频率不合理,也可能是内存容量不够,如果是集群,网络延迟大,另外跟网格划分过细有关系,计算量太大,算不动,具体情况具体分析

5)为什么在超级计算机系统上运行求解计算,还不如单机快
答:多核并行有限度,超级计算机cpu核数多,但频率普遍太低(通常不超过3GHz),某些计算需要有限多核和高频(越高越好),才是最理想的计算架构,另外也可能软件授权的核数有限制

 

欢迎测试验证

  • 4
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值