MIC编程优化（1）——并行度优化

最新推荐文章于 2021-08-06 10:13:54 发布

天山

最新推荐文章于 2021-08-06 10:13:54 发布

阅读量3.6k

点赞数

分类专栏： hpc mic intel xeon phi 文章标签： Intel Xeon Phi MIC MIC高性能计算编程指南性能优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhang0311/article/details/9986805

版权

本文探讨了在Intel Xeon Phi（MIC）上进行并行度和并行粒度优化的重要性。并行度优化涉及到合理设置线程数，以充分利用处理器核资源，而并行粒度的选择则需要平衡线程开销和同步损耗。通过实例分析，建议在外层循环并行以减少线程开销和缓存未命中，但具体情况需视数据访问模式灵活调整，如采用嵌套并行或合并循环等策略。

摘要由CSDN通过智能技术生成

在计算机体系结构中，并行度是指指令并行执行的最大条数。在设计并行程序时，我们可以简单地把并行度认为是在多核/众核处理器上能同时执行的线程数/进程数。对于同一个程序，并行度设计方法的不同将会严重影响到程序的性能。MIC上的并行度优化主要涉及并行线程/进程的数目、并行层级、并行粒度等方面。

1 并行度

MIC卡包含众多的物理核，同时每个核上可以开启4个线程，因此，程序员只有设计足够多的线程/进程才可以把所有的核利用起来。例如一块60个核的MIC卡上，我们最多可以开启240个线程，最佳线程数一般是每个核设置3个或4个线程，图1展示的是某一实际高性能应用程序在60个核的MIC卡上设置不同线程数的性能扩展性结果图，从该图可以看出，只有让MIC卡上的所有核都充分利用起来才能发挥MIC的最大性能。当然，也不是在MIC卡上设置的线程数越多越好，线程数太

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。