《OpenACC并行程序设计:性能优化实践指南》一 3.11 小结

3.11 小结

虽然PIConGPU是一个具体示例,但确定性能瓶颈是真实的,并且所呈现的解决方案也可以应用于其他应用。使用CUDA(PIConGPU实现)或OpenACC对加速器编程,两者没有什么区别。涉及基础MPI活动的改进可用于这两种范例。
本章学习内容:
性能分析是每个程序(并行程序,特别是混合程序)开发的一个组成部分,尽可能高效地利用可用资源。
基于采样的分析运行时开销非常低,可以提供程序执行中潜在的热点。
基于事件的追踪提供程序执行期间所有并行活动的信息。为了不使I/O子系统过载,应该仔细选择日志级别。
通过追踪文件的交互式导航和应用程序各种阶段间歇性分析的可能性,使应用开发人员可以更好地了解应用程序在任何时间点正在做什么。
MPI和加速器的异步活动是高性能的关键。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值