gpu超算算法_2018电磁仿真(HFSS、CST、FEKO)单机集群并行计算特点分析与完美解决方案...

本文深入分析了电磁仿真软件HFSS、CST、FEKO的单机集群并行计算特点,针对时域和频域算法提出硬件配置建议。时域算法适合多核CPU和GPU加速,而频域算法更依赖高频率CPU。文章介绍了不同规模计算任务的硬件配置推荐,包括Intel Xeon Scalable处理器的选择,以及GPU如Tesla V100、P100等在超大规模时域算法求解中的作用。此外,还展示了定制图形工作站品牌UltraLAB的各类机型及其性能对比,为用户提供全方位的电磁仿真计算硬件配置方案。
摘要由CSDN通过智能技术生成

? ? ? ? ? ??2018电磁仿真(HFSS、CST、FEKO)单机集群并行计算特点分析与完美硬件解决方案

一.电磁仿真计算特点与硬件配置分析? ? ? ?电磁场仿真软件广泛应用于无线和有线通信、计算机、卫星、雷达、半导体和微波集成电路、航空航天等领域,从毫米波电路、射频电路封装设计验证,到混合集成电路、PCB板、无源板级器件、RFIC/MMIC设计,天线设计,微波腔体、衰减器、微波转接头、波导录波器等设计等。

1.1电磁仿真算法分类、计算特点? 计算电磁学(CEM)方法大致可分为2类:精确算法和高频近似方法。

(1)全波精确计算法? ? ? ?包括差分法(FDTD,FDFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多极子FMM和多层快速多极子MLFMA)等,其中,在解决电大目标电磁问题中最有效的方法为多层快速多极子方法。

(2)高频近似方法?一般可归作2类:一类基于射线光学,包括几何光学(GO)、几何绕射理论(GTD)以及在GTD基础上发展起来的一致性绕射理论(UTD)等;另一类基于波前光学,包括物理光学(PO)、物理绕射理论(PTD)、等效电磁流方法(MEC)以及增量长度绕射系数法(ILDC)等。

算法计算特点汇总如下NO 关键项 时域算法 频域算法

1 主要算法 时域有限差分

FDTD 时域有限积分

FIT 有限元

FEM 矩量法

MOM

2 典型软件 EMPIRE XPU

XFDTD

EMPro CST HFSS

EMPro

JMAG

FLU FEKO

Momentum

Sonnet

3 计算特点 线性加速比高、高度多线程,

支持多核CPU

支持大型GPU

内存要求不高

回写很少 多线程,线性加速有限

支持多核CPU并行求解

内存要求高

回写有

?小结

1.时域算法,属于显式算法,传统的CPU多核加速比好,核数越多计算越快,此外,并行度高,支持GPU加速计算,注意大部分求解器对GPU要求是双精度计算为主,也就是说需要用双精度性能高的GPU卡。

2频域算法,属于隐式算法,支持多核并行计算,但核数并行计算有限,不支持GPU计算,提升性能的手段,就是提升CPU的频率,足够大的内存,值得注意当内存非常大的时候(超过192GB),硬盘io性能非常关键。

1.2对并行计算求解过程分析? 如何配置CPU要根据求解过程和算法特点,尤其要了解时域、频域两大算法特点紧密结合,这样才能更高效更合理,从并行求解流程图看,循环计算过程是单核和多核交叉过程。

? ? ??上图可以看出,CPU选型非常重要,CPU睿频足够高,大幅缩短【阶段1】求解时间,和整机足够核数+高频运行,大幅缩短【阶段2】的求解器解算时间。

常规工作站卖家,提供的机器往往多核忽视了睿频的重要性,整个计算过程效率非常低。

因此硬件配置注意:?

1.如果是时域算法为主,例如FDTD、FIT求解器,由于并行度高,工作站配置尽量多核,可显著提升求解速度,同时注意阶段1睿频高的处理器更快,如果是以GPU计算为主,可以配置CPU频率高,核数少的,这样整个过程显著提升2.如果是隐式算法为主,例如FEM,MOM求解器,由于并行度有限,一定要睿频尽可能高,同时保证足够的核数的并行ÿ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值