《OpenACC并行程序设计：性能优化实践指南》一 3.11　小结

weixin_33953384

于 2017-09-11 18:58:00 发布

阅读量134

点赞数

文章标签： python

原文链接：https://yq.aliyun.com/articles/213000

版权

3.11　小结

虽然PIConGPU是一个具体示例，但确定性能瓶颈是真实的，并且所呈现的解决方案也可以应用于其他应用。使用CUDA（PIConGPU实现）或OpenACC对加速器编程，两者没有什么区别。涉及基础MPI活动的改进可用于这两种范例。
本章学习内容：
性能分析是每个程序（并行程序，特别是混合程序）开发的一个组成部分，尽可能高效地利用可用资源。
基于采样的分析运行时开销非常低，可以提供程序执行中潜在的热点。
基于事件的追踪提供程序执行期间所有并行活动的信息。为了不使I/O子系统过载，应该仔细选择日志级别。
通过追踪文件的交互式导航和应用程序各种阶段间歇性分析的可能性，使应用开发人员可以更好地了解应用程序在任何时间点正在做什么。
MPI和加速器的异步活动是高性能的关键。

weixin_33953384

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。