CUDA互斥锁/原子操作的探究及相关疑惑

最近由于任务需求,需要把原有的CPU并行程序转换为GPU/CPU异构并行程序,目前程序的基本框架及核心内容已经整理的差不多了。

但原有的CPU并行程序中,使用了大量的QT内置的线程锁#include <QReadWriteLock>,且该部分的原子操作并不能直接使用CUDA库内自带的原子操作函数直接实现,因此需要自己去写互斥锁。

具体的代码如下

__global__ void Kernel()
{
    int i = threadIdx.x + blockIdx.x * blockDim.x;
    if (i < i_SN)
    {
        //计算获得iTemp值
        bool next =true;
        while(next)
        {
            if(0 == atomicCAS(&(d_Box[iTemp].Box_flag),0,1))//d_Box[iTemp].Box_flag为CPU传入GPU的类内成员变量
            {
                doCriticJob();
                atomicExch(&(d_Box[iTemp].Box_flag), 0);
                next=false;
            }
        }
    }
}

然而,在程序中运行的结果时对时错,想问下大家上述问题所在,或是有没有什么更好的互斥锁的写法,谢谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值