一起来学OpenMP(3)——for循环并行化基本用法

原创 2010年06月06日 23:08:00

一、引言

在“一起来学OpenMP(1)——初体验”中给出了一个for循环并行化的例子,这里做进一步的分析,但本节仅描述for循环并行化的基本用法(即#pragma omp parallel for预处理器指示符),该用法需要满足数据不相关性。

 

二、数据相关性

在循环并行化时,由于多个线程同时执行循环,迭代的顺序是不确定的。如果是数据不相关的,则可以采用基本的#pragma omp parallel for预处理器指示符。

如果语句S2与语句S1相关,那么必然存在以下两种情况之一:

1. 语句S1在一次迭代中访问存储单元L,而S2在随后的一次迭代中访问统一存储单元,称之为循环迭代相关(Loop-Carried Dependence);

2. S1和S2在同一循环迭代中访问统一存储单元L,但S1的执行在S2之前,称之为非循环迭代相关(Loop-Independent Dependence)。

 

三、for循环并行化的几种声明形式

上边代码的两种声明形式是一样的,很显然第二种声明形式更为简洁紧凑。

但是第一种声明形式有一个好处,即可以在并行区域内、for循环以外写其他并行代码。

例如:

 

四、for循环并行化的约束条件

尽管OpenMP可以方便地对for循环进行并行化,但并不是所有的for循环都可以进行并行化。以下几种情况不能进行并行化:

1. for循环中的循环变量必须是有符号整形。例如,for (unsigned int i = 0; i < 10; ++i){}会编译不通过;

2. for循环中比较操作符必须是<, <=, >, >=。例如for (int i = 0; i != 10; ++i){}会编译不通过;

3. for循环中的第三个表达式,必须是整数的加减,并且加减的值必须是一个循环不变量。例如for (int i = 0; i != 10; i = i + 1){}会编译不通过;感觉只能++i; i++; --i; 或i--;

4. 如果for循环中的比较操作为<或<=,那么循环变量只能增加;反之亦然。例如for (int i = 0; i != 10; --i)会编译不通过;

5. 循环必须是单入口、单出口,也就是说循环内部不允许能够达到循环以外的跳转语句,exit除外。异常的处理也必须在循环体内处理。例如:若循环体内的break或goto会跳转到循环体外,那么会编译不通过。

 

五、基本for循环并行化举例

 

 

六、嵌套for循环

编译器会让第一个cpu完成:

会让第二个cpu完成:

 

 

七、小节

本节首先给出了数据相关的概念,然后对基本for循环并行化方法进行了描述,并指出了#pragma omp parallel for预处理指示符不能应用的场合。后续讲述数据竞争时再对其他种类的for循环并行化进行描述。

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

OpenMP并行程序设计——for循环并行化详解

在C/C++中使用OpenMP优化代码方便又简单,代码中需要并行处理的往往是一些比较耗时的for循环,所以重点介绍一下OpenMP中for循环的应用。个人感觉只要掌握了文中讲的这些就足够了,如果想要学...

OpenMP编程入门之一

当前多核多线程CPU大行其道,如果不能充分利用岂不是太可惜了!特别在图像处理领域,简直是为并行计算而生的!在网上看了不少文章,还是自己总结一下吧。...
  • wyjkk
  • wyjkk
  • 2011年07月17日 14:32
  • 10376

OpenMP并行程序设计(二)

 OpenMP并行程序设计(二)... 11、fork/join并行执行模式的概念... 12、OpenMP指令和库函数介绍... 13、parallel 指令的用法... 34、for指令的使用方法...

openmp在多重循环内的简单使用及其详解

由于项目需求,在三重循环内加入了并行计算,但由于只能在内层循环加入,而内层循环只有32维度,因此速度提高的也就那么几毫秒。 在此 不再将代码贴出! 以下是转载的别人博客中的详细讲解,很不错!   ...

OpenMP: 程序for循环并行效率优化

#pragma omp parallel for 这条语句是用来指定后面的for循环语句变成并行执行的,将for循环里的语句变成并行执行后效率会不会提高呢?还是测试一 下吧,测试的时候,循环最好大一些...
  • Augusdi
  • Augusdi
  • 2013年04月15日 20:08
  • 2776

OpenMP #pragma omp parallel for并行化小探究

今天用了一下openmp,本人表示非常喜欢openmp的傻瓜化模式,导入一个头文件直接parallel for#include #include using namespace std;int ma...

OpenMP: 循环结构的并行

在科学和工程应用中,许多程序都要在循环执行上花大量的时间,如Fortran中的do循环和C语言中的for循环,通过并行中的loop-level可以减少这些循环的运行时间。OpenMP提供了parall...
  • Augusdi
  • Augusdi
  • 2013年04月16日 12:36
  • 4050

有关Pca的使用:样本数目和降维数目的关系

解析Pca中为什么降维后样本数要严格大于特征数

Dlib机器学习库系列2----人脸检测

这是Dlib库学习系列的第二篇,主要介绍人脸检测。Dlib库的人脸检测算法使用的hog特征与级联分类器。废话少说,下面开始。 步骤一:建立工程,配置工程。 建立工程就不多说了,不用预编译头...

一起来学OpenMP(3)——for循环并行化基本用法

一、引言 在“一起来学OpenMP(1)——初体验”中给出了一个for循环并行化的例子,这里做进一步的分析,但本节仅描述for循环并行化的基本用法(即#pragma omp parallel for...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:一起来学OpenMP(3)——for循环并行化基本用法
举报原因:
原因补充:

(最多只允许输入30个字)