OpenMP--private, shared变量

             最近刚学OpenMP, 上来就遇到一个循环嵌套的问题,下面这段代码就是输出2*5个数,但是结果只输出了5+1个数

 

int i=0;int j=6;
#pragma omp parallel for
for (i = 0; i < 2; ++i)  
  {  
   for (j = 0; j < 5; ++j)  
   {  
    printf("i=%d j=%d\n from thread = %d\n", i, j, omp_get_thread_num());
   }  
  } 

 

结果:

以下几种方法都能输出正确结果:

 代码1:

int i=0;int j=6;
#pragma omp parallel for private(j)
for (i = 0; i < 2; ++i)  
  {  
   for (j = 0; j < 5; ++j)  
   {  
    printf("i=%d j=%d\n from thread = %d\n", i, j, omp_get_thread_num());
   }  
  }

 代码2:

int i=0;int j=6;
#pragma omp parallel for private(j)
for (i = 0; i < 2; ++i)    
  {  
   for (int j = 0; j < 5; ++j)  
   {  
    printf("i=%d j=%d\n from thread = %d\n", i, j, omp_get_thread_num());
   }  
  }

结果:

          其实就是OpenMP中变量的类型问题。并行计算时循环变量应该是私有的,这样每个线程会有自己的变量副本,从而不会影响其他线程的运行。而之前出现的错误就是因为变量j默认是shared类型的,多个线程使用同样的j值,这样一来,线程0里j会不断增大至最大值4,而线程1运行时,j已经增大为4,因此线程1中只输出一次。但为什么是1次,现在还没搞清楚,回头可以看看现在是不是真的支持嵌套并行,可能是假的嵌套并行。

         OpenMP中变量默认为shared,因此第一个程序中的j是shared;在并行for循环中紧临parallel for 语句的循环变量是私有的,因此i是私有的;并行区域代码块里的声明的变量是私有的,所有通过private,firstprivate,lastprivate和reduction子句声明的变量为私有变量,因此后两个代码中j是私有的。

一个变量可以有三种类型,即sharedprivatereduction默认为shared,除非如下三种特别情况:

一、在并行for循环中紧临parallel for 语句的循环变量是私有的;

二、并行区域代码块里的声明的变量是私有的;

三、所有通过private,firstprivate,lastprivate和reduction子句声明的变量为私有变量

        其中shared表示在并行结构中将有一个单独的内存位置来存放这个变量,所有的并行线程都可以使用这个变量,所有的并行线程将共享这块内存地址,因此,线程间的通信通过普通的读写操作方式就可以实现,当然,这个变量也可以随意被任何一个线程修改。相反,private变量将会有多个内存地址,每个线程里面一个。这个变量的所有读写操作都只限于本线程,其他线程是无法访问本线程中该变量的内存地址的。所以,一般都用于定义临时变量。reduction就有点难理解了,它具有sharedprivate的特征,最常见的例子就是计算并行结构中最后的临时局部变量的总和。

 

================================== 数据环境(Data Environment) ================================== OpenMP属于共享内存的编程模型。在我们的多线程代码中,大部分数据都是可以共享的。共享内存给我们程序中数据的共享带来了极大的便利。因此在默认情况下,OpenMP将全局变量、静态变量设置为共享属性。 但是,还是有些变量需要是每个线程私有的,也就是每个线程有这些变量的独立拷贝,这样每个线程在使用这些变量时不会相互影响。需要私有的变量包括:  我们可以通过如下方法来改变OpenMP的变量默认属性,你可以把它设置为共享(shared)或无。也可以单独改变某几个变量的属性,把他们设置为shared或private。  看看下面这个例子,循环变量i默认为私有,因为x和y是中间变量,应该设置为私有,否则线程之间的x,y会互相影响。  再看看这个例子。变量sum定义在并行区之外,所以默认为共享,这个例子里又写了shared(sum),没错,但是实际上是罗嗦了。那么这个例子里有什么错误呢?  如果以前做过多线程开发的话应该能看出来,sum不应该是共享的,但是设置为私有的也不对。我们的做法应该是将sum保护起来,防止多个线程同时对sum进行写操作。我们可以使用OpenMP的临界区来对sum进行保护。  我们可以给临界区命名,在下面例子中,如果我们不给临界区命名,在任一时刻,只能有一个线程调用consum函数。而我们给临界区命名后,任一时刻可以有 最多2个线程在调用consum函数(1个调用 consum(B, &R1),另一个调用 consum(A, &R2)。这在这2句语句可以同时执行的情况下,我们通过临界区命名来尽可能减少线程等待时间。  归约(Redunction)是个很有用的功能,可以简化我们的编程,op代表一个操作,list是执行这个操作的一个或多个变量。  我们再看刚才上面的例子就清楚了。我们对sum这个变量使用归约操作,操作符是+。这样的话,每个线程就会有一个私有的sum变量,当所有线程的计算完成 后,每个线程的私有的sum的值将被用“+”归约成一个总的sum,即 线程1的sum + 线程2的sum + ... + 线程n的sum -> 总的sum,这个总的sum值将被带出并行区并赋给全局的那个sum变量,因此,当这个并行区的代码执行完以后,我们的sum变量的值就是我们期望得到的 值了。 是不是比前面用临界区的方法要好得多、代码也会快得多呢?  下图是归约支持的操作符:  好了,来给大家做个小作业。下面代码是一个串行的求Pi的代码,使用的是积分的办法。请大家把这个代码用OpenMP来做并行化。  

  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值