并行编程20-30

最新推荐文章于 2022-08-08 08:29:56 发布

bigwhitecat

最新推荐文章于 2022-08-08 08:29:56 发布

阅读量353

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bigwhitecat/article/details/48603627

版权

推进有些慢。学习openmp的小结。

1.对于单纯的parallel语句

竞争条件多个线程试图控制访问一个共享资源，并且至少其中一个访问是更新该共享资源，可能导致错误

引起竞争条件的代码称为临界区。临界区是一个被多个更新共享资源的线程执行的代码，并且共享资源一次只能被一个线程更新。

用critical指令对临界区的代码进行控制。

#pragmaomp critical

这条指令告诉编译器需要安排线程对下列的代码块进行互斥访问。

2.规约子句

定义一个归约变量来表示归约的结果。

3.对于openmp中的parallel for

主要是消除其for循环中的数据依赖，

消除循环依赖，主要通过修改代码语句形式

除了消除循环依赖，还需要保证每个线程有其自己的某变量副本，保证其变量有私有作用域。一个线程对此变量的更新不会影响另一个线程此变量的值。

4.关于作用域

需通过了解程序，显示的明确每个变量的作用域

语句为#pragmaomp parallel for num_threads()\

Default(none)reduction() private() shared()

5.用parallel指令在外部循环前创建thread_count个线程的集合。然后，使用一个for指令，告诉openmp使用已有的线程组来并行化for循环

#pragmaomp parallel

for()

for()

#pragma omp for

for()

#pragma omp for

6.循环调度

Parallelfor指令，循环分配给线程的操作是由系统完成的，大部分即粗略的使用块分割。

将循环分配给线程称为调度，schedule子句用于在parallel for 或者 for指令中进行迭代分配。

scheduletype:

static迭代在循环执行前分配给线程

dynamicguided 迭代在循环执行时分配给线程

auto编译器和运行时系统决定调度方式

runtime调度在运行时决定

如果不使用schedule子句就已经达到了令人满意的性能，就不需要再进行多余的工作。但是，如果怀疑默认调度的性能可以提升，那么可以对各种调度进行试验。

通过改变线程个数和迭代次数进行试验最优的调度方式是由线程个数和迭代次数共同决定

关于调度选择的一个小结：

如果循环的每次迭代需要几乎相同的计算量，那么可能默认的调度方式能提供最好的性能

如果随着循环的进行，迭代的计算量呈线性递增，那么采用较小的chunksize的static调度可能会提供最好的性能

如果每次迭代的开销事先不能确定，那么可能需要尝试多种不同的调度策略

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
并行编程20-30

推进有些慢。学习openmp的小结。1.对于单纯的parallel语句竞争条件多个线程试图控制访问一个共享资源，并且至少其中一个访问是更新该共享资源，可能导致错误引起竞争条件的代码称为临界区。临界区是一个被多个更新共享资源的线程执行的代码，并且共享资源一次只能被一个线程更新。用critical指令对临界区的代码进行控制。#pragmaomp critical这条指令告
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。