周伟明的多核、测试专栏

有中生无,有即是无,色即是空;无中生有,无即是有,空即是色

用户操作
[留言]  [发消息]  [加为好友] 
订阅我的博客
XML聚合    FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
drzhouweiming的公告
<ul class="list"><li class="listitem"><a href="http://gforge.osdn.net.cn/projects/capi" target="_blank"> 多核算法库CAPI 0.20版 </a></li></ul> 已发布。<br> <a href="http://product.dangdang.com/product.aspx?product_id=20522078"> <IMG SRC="http://p.blog.csdn.net/images/p_blog_csdn_net/drzhouweiming/EntryImages/20090314/MulticoreComputing128.jpg" width="128" height="181" border=0> <br> 多核计算与程序设计-当当</a> <br> <a href="http://product.dangdang.com/product.aspx?product_id=20207722"> <IMG SRC="http://p.blog.csdn.net/images/p_blog_csdn_net/drzhouweiming/EntryImages/20090314/SoftwareTest128.jpg" width="128" height="165" border=0> <br> 软件测试实践-当当 </a> <BR> <a href="http://www.dearbook.com.cn/book/107608"> <IMG SRC="http://p.blog.csdn.net/images/p_blog_csdn_net/drzhouweiming/EntryImages/20090314/MultiTask12811.jpg" width="128" height="161" border=0> <br> 多任务下的数据结构与算法</a> <br>
文章分类
最近文章
1、多核新观念-象使用内存一样使用CPU?
2、多核编程中的任务随机竞争模式的概率分析
3、OpenMP创建线程中的锁及原子操作性能比较
4、多核编程中的任务分组竞争模式
5、称球问题的测试解法
90%程序员写不出无BUG的二分查找程序?
C/C++代码检视实例
多核编程中的负载平衡难题
多核编程中的锁竞争难题
微软过桥问题与测试人员素养
接口关系稳定原理探索
接口设计定理
模块分解原理与三权分立
模块分解原理的探索
测试驱动需求分析
筑一座坝治好中国的沙漠
存档

原创  多核编程中的条件同步模式 收藏

多核编程中的条件同步模式

 

在多线程编程中,当对共享资源进行操作时,需要使用同步(通常是锁或原子操作)来进行保护,以避免数据竞争问题。不幸的是,同步操作的开销非常大,比如对一个整数变量进行加法操作,那么同步操作的开销是加法操作的上百倍以上。

有没有办法可以减少这种同步操作的开销呢?如果能设计出更快的锁或更快的原子操作来,那么这种开销自然就减少了。以目前的技术来看,最快速的原子操作耗时也是普通加法操作的上百倍,所以从这方面着手是非常困难的。

那么能不能从软件算法的角度来减少同步操作的开销呢?答案是当然可以,基本思想是减少使用同步的次数,比如原来要使用同步1000次,现在改为在满足一定条件下才使用同步,只需要10次,那么同步的开销平摊下来就被减少了100倍,效率大大提高了。下面先来看一个共享队列例子。

一个普通的共享队列通常都是使用锁来实现,当然也有用CAS原子操作来实现的,这里只讨论用锁来实现的共享队列。

在有锁保护的共享队列中,在队列的进队和出队操作时,通常都是使用锁来进行保护的,一个典型的使用锁保护的出队操作伪代码如下:

       template class <T>

       Locked_DeQueue(T &data)

       {

              Lock();

              DeQueue(data);  //调用串行的出队操作

              Unlock();

       }

 

在使用上面的Locked_DeQueue()函数时,每调用一次,就会发生一次锁操作。事实上,并不是每次都需要加锁操作的,比如队列为空时,这时实际上是不需要进行出队操作的,完全可以采取的一定的方法避免锁操作,但是采用上面的Locked_DeQueue()函数无法避免锁操作,这就需要对上面的函数进行改进。

一种最容易想到的方面就是先判断队列是否为空,如果不为空才使用锁保护进行出队操作。代码如下:

       template class <T>

       Locked_DeQueue_a(T &data)

       {

              If ( !IsEmpty() )

              {

                     Lock();

                     DeQueue(data);  //调用串行的出队操作

                     Unlock();

              }

       }

 

上面的Locked_DeQueue_a()函数的一个关键之处是IsEmpty()函数必须不能使用锁操作,否则不仅没有减少同步开销,反而将同步开销增大了近一倍。

如何来使得IsEmtpy()函数不用锁操作呢,以数组实现的环行队列为例,在判断队列是否为空时,其基本方法是判断队首指针是否等于队尾指针。伪代码如下:

INT IsEmpty()

{

       Lock()

       if ( 队首指针 == 队尾指针 )

       {

              Unlock();

              return 1; //为空

       }

       else

       {    

              Unlock();

              return 0; //非空

       }

}

 

由于队首指针和队尾指针在进队或出队操作时会发生改变,因此在上面的IsEmpty()函数中,需要使用锁保护,那么如何去掉这层锁保护呢?

基本的方法是设一个标志变量EmptyFlag,在进队和出队操作中,当队列为空时,标志变量的值置为1,队列非空时,标志变量的值置为0。这样判断队列是否为空就可以通过EmptyFlag单个变量来进行,而单个变量的读写可以使用原子操作来实现,使得读操作和普通操作一样不存在同步操作。

下面是使用EmptyFlag变量实现的出队操作。

       template class <T>

       Locked_DeQueue_b(T &data)

       {

              if ( EmptyFlag )

              {

                     return;

              }

              Lock();

              if ( !EmptyFlag )  //Lock(), 其他线程可能修改了标志

              {

                     DeQueue(data);  //调用串行的出队操作

                  if ( 队首指针 == 队尾指针 )

                  {

                      //出队后,队列变空,使用原子操作将EmptyFlag置为1

                      AtomicIncrement(&EmptyFlag);

                  }

              }

              Unlock();

       }

 

队列的是否为空函数可以使用下面的完全不需要同步的实现。

       INT IsEmpty()

       {

              return EmptyFlag;

       }

 

Locked_DeQueue_b()函数的实现可以看出,如果队列本来为空的情况下,它只判断一个EmptyFlag就返回了,不会调用锁操作,减少了同步使用的次数,并且在IsEmpty()函数中,根本不需要使用同步,这对于那些需要频繁判断队列是否为空的使用场景,有很好的效果。

比如对于动态任务调度,假设使用普通的有锁的共享队列。当一个线程私有队列为空时,需要去偷取其他线程的共享队列中的任务,如果偷取的队列为空则发生了一次锁操作,此时需要再偷另外一个队列的任务,如果这个队列仍然为空则又要一次锁操作,一次获取任务的操作中将可能出现多次加锁解锁的情况。通过上面讲的条件同步方法就可以在偷取取一个任务时,只要一次锁操作就可以实现。

上面讲的条件同步模式非常适应于具有状态机性质的场合,只有在发生状态切换(例如队列中空或非空的状态的切换)时才使用同步,通过对状态变量(例如EmptyFlag)的操作来替代其他非状态变量(例如队首指针和队尾指针)的操作,减少同步的使用。

 

发表于 @ 2009年03月20日 11:06:00 | 评论( loading... ) | 编辑| 举报| 收藏

旧一篇:多核编程的四层境界 | 新一篇:多核分布式队列的实现:偷与自私的运用

  • 发表评论
  • 评论内容:
  •  
Copyright © drzhouweiming
Powered by CSDN Blog