最近由于任务需求,需要把原有的CPU并行程序转换为GPU/CPU异构并行程序,目前程序的基本框架及核心内容已经整理的差不多了。
但原有的CPU并行程序中,使用了大量的QT内置的线程锁#include <QReadWriteLock>,且该部分的原子操作并不能直接使用CUDA库内自带的原子操作函数直接实现,因此需要自己去写互斥锁。
具体的代码如下
__global__ void Kernel()
{
int i = threadIdx.x + blockIdx.x * blockDim.x;
if (i < i_SN)
{
//计算获得iTemp值
bool next =true;
while(next)
{
if(0 == atomicCAS(&(d_Box[iTemp].Box_flag),0,1))//d_Box[iTemp].Box_flag为CPU传入GPU的类内成员变量
{
doCriticJob();
atomicExch(&(d_Box[iTemp].Box_flag), 0);
next=false;
}
}
}
}
然而,在程序中运行的结果时对时错,想问下大家上述问题所在,或是有没有什么更好的互斥锁的写法,谢谢!