cuda练习(二)：灰度统计直方图

最新推荐文章于 2023-01-02 13:53:00 发布

lingsuifenfei123

最新推荐文章于 2023-01-02 13:53:00 发布

阅读量1.8k

点赞数 1

分类专栏： cuda学习文章标签： cuda opencv 图像

本文链接：https://blog.csdn.net/lingsuifenfei123/article/details/83476009

版权

编写代码

首先将上次的转灰度图的程序拷过来用于生成灰度图

共编写了cpu、gpu_wrong_naive、gpu_naive、gpu_usesharemem四种方式实现

cpu版本

cpu版本代码很简单：

void getGrayHistincpu(unsigned char * const grayData, 
                    unsigned int * const hist,
                    uint imgheight,
                    uint imgwidth)
{
    for(int i = 0; i < imgheight; i++)
    {
        for (int j = 0; j < imgwidth; j++)
        {
            hist[grayData[i*imgwidth+j]]++;
        }
    }
}

gpu版本1——直接照搬 gpu_wrong_naive

__global__ void getGrayHistincuda_wrong_naive(unsigned char * const grayData, 
                                unsigned int * const hist,
                                uint imgheight,
                                uint imgwidth)  //会发生冲突，数值每次会变化
{
    const unsigned int idx = blockDim.x * blockIdx.x + threadIdx.x;
    const unsigned int idy = blockDim.y * blockIdx.y + threadIdx.y;    

    if(idx < imgwidth && idy < imgheight)
    {
        const unsigned long pid = imgwidth * idy + idx;
        const unsigned char value = grayData[pid];
        hist[value]++;
    }
}

这个代码有问题，因为各个线程会同时访问同一块全局内存，数值会不正确

gpu版本2——原子操作 gpu_naive

__global__ void getGrayHistincuda_naive(unsigned char * const grayData, 
                                            unsigned int * const hist,
                                            uint imgheight,
                                            uint imgwidth)  //使用原子操作保证数值正确
{
    const unsigned int idx = blockDim.x * blockIdx.x + threadIdx.x;
    const unsigned int idy = blockDim.y * blockIdx.y + threadIdx.y;    

    if(idx < imgwidth && idy < imgheight)
    {
        const unsigned long pid = imgwidth * idy + idx;
        const unsigned char value = grayData[pid];
        atomicAdd(&(hist[value]), 1);

最低0.47元/天解锁文章

lingsuifenfei123

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
cuda练习(二)：灰度统计直方图

编写代码首先将上次的转灰度图的程序拷过来用于生成灰度图共编写了cpu、gpu_wrong_naive、gpu_naive、gpu_usesharemem四种方式实现cpu版本cpu版本代码很简单：void getGrayHistincpu(unsigned char * const grayData, unsigned int * const h...
复制链接

扫一扫

专栏目录