Enhancing Monte Carlo Particle Transport for Modern Many-core Architectures--引言

作者:R.C.Bleile

摘要:

自从电子计算开始之初,蒙特卡洛粒子传输一直是解决物理问题的一个典型的方法。由于这些应用对于高计算的需求以及内在的并行性质,蒙特卡洛传输应用常常运行在超级计算机环境上。也就是说,由于每一个节点并行能力也在迅速提升,超级计算机的随之发展,包括常规的多核设备(如GPU)。蒙特卡洛传输应用,像所有其他运行在超级计算机上的应用一样,被迫在他们的的设计上做出重大改变,为了更好的利用这新架构。这篇论文展示了对于在这种变化的环境中蒙特卡洛粒子传输问题所面对的核心挑战的一些解决方案,特别是在线程模型、跟踪算法、计数数据收集以及异构负载均衡领域。除此之外,这篇论文在最后还做了一项研究,将所有提出的技术结合到了劳伦斯利弗莫尔国家实验室的 RZAnsel 超级计算机上的大规模生产应用中。

1.动机:

蒙特卡洛方法是是一类数值算法,通过使用伪随机数进行概率分布采样来解决问题。它运用于很多的问题,蒙特卡洛粒子传输便是其中的一个应用,它是蒙特卡洛方法结合物理上粒子传输。而其对应的概率分布表示的是粒子之间的相互作用和碰撞发生的可能性。为了实现高度精确性,它需要跟踪足够数量的粒子进入设定的区域。通常,这个数量非常巨大,以至于需要(HPC:high performance computing)高性能计算平台去准确快速的计算。

在过去的几十多年,高性能计算环境逐步向着多核计算架构发展。2019年的世界超级计算机500强榜单中,主要是以大规模GPU构建的系统或者基于多核的系统。因此,为了使这些运行在超级计算机上的应用程序继续适应新的架构是非常重要的。本文的关注点不止是如何充分的利用计算机资源,另一个方面也研究如何在不同的计算机硬件上运行,例如在不同的GPU上。蒙特卡洛粒子传输应用便是需要做出这种转换以便适应新的计算环境。然而,我们并不清楚所经历的这种转换。当前的蒙特卡洛传输应用,在其并行化的时候,并不是特别适应现在的加速器结构(蒙特卡洛传输收到的是内存延迟限制而不是计算限制,它每一个线程需要大量的局部内存,并且对于蒙特卡洛模拟的粒子,其有不同的行为。)

这篇论文便响应了这种变化且充满挑战的环境,它的目标便是去阐明,怎样把蒙特卡洛传输转化为在多核架构上的极好的算法。

1.1研究问题

这篇论文回答了如下的主要问题:

对于蒙特卡洛粒子传输算法,什么改变能够有效的利用多核架构?

更进一步,这个问题假定在这个改变将扩展现有的先进技术,而不是牺牲任何当前的能力。特别的,这种改变应当支持典型的HPC架构(例如,这个代码应当工作在多核架构和常规的CPU平台)并且这个算法能够有效的适用于不同的问题(例如:对于不同的物理、网格、和粒子数量都计数的工作负载)。为了研究好这一问题,我们把上述问题分成四个子问题,一个问题代表一部分的研究。

1.什么样的跟踪算法更加适合于现代多核架构系统上的蒙特卡洛粒子传输的可移植性?

2.管理数据竞争以及满足多核架构平台的内存需求的最好方式是什么?

3.充分利用异构节点架构值得吗?

4.当我们扩大MPI资源,聚焦于多核的算法的开发如何影响性能问题?

1.2 论文框架

第一章:引言

第二章: 背景和相关工作

第三章:跟踪算法

第四章:数据竞争管理:线程模型

第五章:数据竞争管理:输出计数数据

第六章:异构节点架构的利用

第七章:规模上的性能表现

第八章:结论和未来工作

  • 11
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值