基于共享内存的位图——GPU高性能编程CUDA实战5.3.3

本文通过一个基于CUDA的GPU编程实例,探讨了在线程块内使用共享内存和线程同步对于正确输出图像的重要性。在计算过程中,每个线程块的16x16个线程执行数学运算并将结果存储到共享内存,随后通过线程同步确保所有线程完成计算后再进行输出,避免了数据错误。实验结果展示了线程同步在图像处理中的关键作用。
摘要由CSDN通过智能技术生成

当对一个线程块里的线程数据进行同时输出的时候,这个实验室输出了一个图像,需要进行同步操作,否则在输出的图像的时候会出现错误,原因是线程里的数据肯定是不对的,或者是还没有写进去就已经输出出来,共享内存里的数据有些是之前没有修改前的数据

那么来看一看代码,之前有在别的博客里写过的就不再写了。虽然我学习的进度有点慢,还是要抓紧时间的

#include "cuda.h"
#include "../common/book.h"
#include "../common/cpu_bitmap.h"


#define DIM 1024
#define PI 3.1415926535897932f


__global__ void kernel( unsigned char *ptr ) {
    // map from threadIdx/BlockIdx to pixel position
    int x = threadIdx.x + blockIdx.x * blockDim.x;
    int y = threadIdx.y + blockIdx.y * blockDim.y;
    int offset = x + y * blockDim.x * gridDim.x;

这里共享的内存是一个二维16*16大小的数组,也就是说下面程序里定义的每个线

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值