台式计算机运行fdtd配置,基于CPU-GPU 异构机群的FDTD 并行算法加速研究(三)...

相关资料:

3 测试结果与分析

实验平台包括 HD5870 GPU、Tesla C2050 GPU

和IntelXeon X5650 处理器机群,其主要的处理器体系结构参数如表3

所示。实验中所使用的数据集与第二节分析程序中的数据一致,如表1 所示。

a4c26d1e5885305701be709a3d33442f.png

为了实验的对比分析,我们实现了4 个版本的FDTD程序:CPU 上执行的FDTD-serial 串行程序、多核CPU

上执行的FDTD-MPI 并行程序、ATI GPU 上执行的FDTDOpenCL加速程序和NVIDIA GPU

上执行的FDTD-CUDA加速程序。目前而言,单精度计算可以满足所测试FDTD实验场景的需求,所以不开启OpenCL

的双精度浮点运算支持。评价总体性能的标准为GPU 版相对CPU 版的加速比,计算公式为CPU 执行时间/GPU

执行时间。

3.1 GPU 加速分析

图 7 显示FDTD 在SMALL 数据集下,在1 个CPU 核、4 个CPU 核、8 个CPU

核、Tesla C2050 GPU 和HD5870 GPU下计算时间对比。多CPU 核使用MPI 调度数据,GPU

加速代码为OpenCL.由图可见,在SMALL 数据集下,使用HD5870,OpenCL 加速相对CPU

加速比可达到8.11,且性能比8 个CPU 的MPI 加速性能还要好。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
时域有限差分法(FDTD)是一种计算电磁学问题的数值方法,适用于求解Maxwell方程。该方法的主要思想是将空间和时间都离散化成网格,并通过有限差分近似地代替偏微分运算。通过迭代计算可以得到网格点上的电磁场的值,从而求解出整个空间内电磁场的分布。 FDTD方法有很多优点,比如适用于任意形状的结构、处理非线性材料、计算效率高等。同时,也有一些缺点,比如需要选取合适的网格尺寸、误差随时间增加等问题。但总的来说,FDTD方法在计算电磁学问题方面有着广泛的应用。 本文着重介绍了FDTD的基本原理、算法流程和注意事项。其中,最重要的是在计算过程中要考虑不同介质的性质,可以通过模拟电介质的强度、磁导率、电导率和介电常数等参数来准确计算电磁场的分布。文章也提到了一些改进方法和应用场景,比如在光子晶体、天线和微波器件的设计中,可以利用FDTD方法来求解电磁场分布和传输特性,从而优化设计方案。 作为一种数值方法,FDTD方法的应用需要基于实际模型和精确的参数,因此需要进行大量的实验和数据处理。同时,不同版本的FDTD算法也在不断发展和改进中,可以更加准确地模拟和预测电磁场的分布和传输特性。本文所述的内容虽然比较简要,但足以深入了解FDTD的基本原理和应用价值,对于有兴趣研究电磁学问题的人员具有很大的参考价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值