msiafterburner并行配置不正确_电磁仿真(HFSS、CST、FEKO)时域频域精准配置推荐2019...

一.电磁仿真计算特点与硬件配置分析

122708b107363faf4c6fa73317e8e717.png

电磁仿真

电磁仿真广泛应用于无线和有线通信、计算机、卫星、雷达、半导体和微波集成电路、航空航天等领域,从毫米波电路、射频电路封装设计验证,到混合集成电路、PCB板、无源板级器件、RFIC/MMIC设计,天线设计,微波腔体、衰减器、微波转接头、波导录波器等设计等。

6acdeaf4181b552d473366f4770ff172.png

电磁仿真

1.1 电磁仿真算法分类、计算特点计算电磁学(CEM)方法大致可分为2类:精确算法高频近似方法

(1)全波精确计算法

包括差分法(FDTD,FDFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多极子FMM和多层快速多极子MLFMA)等,其中,在解决大目标电磁问题中最有效的方法为多层快速多极子方法。

(2)高频近似方法

一般可归作2类:一类基于射线光学,包括几何光学(GO)、几何绕射理论(GTD)以及在GTD 基础上发展起来的一致性绕射理论(UTD)等;另一类基于波前光学,包括物理光学(PO)、物理绕射理论(PTD)、等效电磁流方法(MEC)以及增量长度绕射系数法(ILDC)等。

539494a253854a71a35bad64bc07c7f3

算法分类

算法计算特点汇总如下

c1fbfbf6173152211162bef28e07ed66.png

算法汇总

小结

1. 时域算法,属于显式算法,传统的CPU多核加速比好,核数越多计算越快,此外,并行度高,支持GPU加速计算,注意大部分求解器对GPU要求是双精度计算为主,也就是说需要用双精度性能高的GPU卡。

2. 频域算法,属于隐式算法支持多核并行计算,但核数并行计算有限不支持GPU计算,提升性能的手段,就是提升CPU的频率,足够大的内存,值得注意当内存非常大的时候(超过192GB),硬盘io性能非常关键。

1.2 对并行计算求解过程分析如何配置CPU要根据求解过程和算法特点,尤其要了解时域、频域两大算法特点紧密结合,这样才能更高效更合理,从并行求解流程图看,循环计算过程是单核和多核交叉过程。

e960388ac32d427ba5aab1d5a3820b0d.png

工作站处理过程

上图可以看出,CPU选型非常重要,CPU睿频足够高,大幅缩短【阶段1】求解时间,和整机足够核数+高频运行,大幅缩短【阶段2】的求解器解算时间

常规工作站卖家,提供的机器往往多核忽视了睿频的重要性,整个计算过程效率非常低。

因此 硬件配置注意:

1. 如果是时域算法为主,例如 FDTD、FIT求解器,由于并行度高,工作站配置尽量多核,可显著提升求解速度,同时注意阶段1睿频高的处理器更快,如果是以GPU计算为主,可以配置CPU频率高,核数少的,这样整个过程显著提升。

2. 如果是隐式算法为主,例如 FEM,MOM求解器,由于并行度有限,一定要睿频尽可能高,同时保证足够的核数的并行,这样整个求解过程无死角瓶颈。

3. 如果是多种算法并用,CPU要足够核数与高睿频之间选择一个兼顾的规格,三种应用(时域算法、频域算法、混合算法)都均能确保工作站硬件计算性能最大化。

考虑到上述计算特点,CPU的选择对整个求解过程极其重要,下面是最新上市的intel Xeon Schalable(可扩展)处理器多种规格,UltraLAB选型分析:

f18aa3de705132fb2848e26fa2bba1b4.png

CPU选择分析 1

55b84f857e5f688a9b09ca6a774bab16.png

CPU选择分析 2

1.3 CEM求解规模与硬件配置推荐

a)基于时域算法硬件配置参考(CPU类)

cb66ace0bac3b8a2c56245e0c172c893.png

b)基于频域算法硬件配置参考

35212f63fc54c4240af5820234bf17a6.png

c)基于超大规模时域算法求解GPU选型

9af2edce99833417062e6bbaa4281087.png

GPU选择

如果以GPU求解为为主,可选的GPU卡参考下表

7500c4729a9386f5d0545feae2a95d61.png

GPU卡参考

二.基于电磁仿真计算的机型介绍以ultralab定制图形工作站为例

2.1. 极速图形工作站H490

8b4207234c4cb9e18b5e31b04bee3dbc.png

ultralab H490

配置特点:(1)CPU具有高频率,适合中小规模时域与频域求解6核5.0GHz,8~10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz(2)GPU支持双GPU架构超算显著优势:和市场上单路cpu架构的工作站(单Xeon E5v4,单Xeon W-2100系列,单Xeon Schalable系列)相比,拥有超高频率,在多核并行计算(特别是频域求解),性能出众

2.2. 高性能计算工作站EX620

532768bedfbb0de3edad02079a74f75f.png

ultralab EX620

配置特点:

CPU支持双Xeon Schalable(可扩展)处理器,拥有更高频率和更低延迟,适合中大规模时域与频域求解提供规格:24核*4GHz/4.2GHz

36核3.7GHz/3.7GHz

40核3.1GHz/3.7GHz

48核*3.5GHz/3.7GHz

56核*3.3GHz/3.8GHz

GPU支持双GPU架构超算显著优势:和市场上常规双路cpu工作站(双Xeon E5v4,双Xeon Schalable系列)相比,拥有更高频率,多核并行计算(时域、频域算法),定位精准高效,显式计算(EX620i)、显式隐式计算通吃(EX620)

2.3. 超大规模仿真计算机型Alpha720

f6ec7639c858085983ad9826d9cc4f2e.png

ultralab Alpha720

配置特点:

CPU支持4颗Xeon E7v4处理器(最高到96核),拥有更高频率和更低延迟,适合超大规模时域算法求解提供规格:72核2.8GHz,96核2.7GHz

GPU支持双GPU架构超算显著优势:时域求解(CPU计算架构)工作站

2.4. 图灵超算工作站GX490M或GX620M

7d9a35697b14b720bb391058376f3e10.png

ultralab GX490M/GX620M

GX490M配置特点:

CPU具有高频率,适合中小规模时域与频域求提供规格:10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz

GPU支持7块双槽GPU卡

GX620M配置特点:

CPU支持双Xeon Schalable(可扩展)处理器,拥有更高频率和更低延迟,中大规模时域与频域求解,发挥极致性能提供规格:24核4GHz,36核3.7GHz,40核3.1GHz,48核3.5GHz,56核3.3GHz

GPU支持9块双槽GPU卡显著优势:基于办公环境(静音级)GPU超算性能时域求解计算系统,同时兼顾频域隐式算法

各种机型性能与差异对比表

9ecee7d40977438f4c9e96941455a87f.png

各种机型性能与差异对比表

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值