基于共享内存的位图——GPU高性能编程CUDA实战5.3.3

最新推荐文章于 2021-12-31 21:30:48 发布

ElegantIce

最新推荐文章于 2021-12-31 21:30:48 发布

阅读量1.3k

点赞数

分类专栏： cuda 文章标签： gpu cuda 多线程

本文链接：https://blog.csdn.net/ElegantIce/article/details/44814903

版权

本文通过一个基于CUDA的GPU编程实例，探讨了在线程块内使用共享内存和线程同步对于正确输出图像的重要性。在计算过程中，每个线程块的16x16个线程执行数学运算并将结果存储到共享内存，随后通过线程同步确保所有线程完成计算后再进行输出，避免了数据错误。实验结果展示了线程同步在图像处理中的关键作用。

摘要由CSDN通过智能技术生成

当对一个线程块里的线程数据进行同时输出的时候，这个实验室输出了一个图像，需要进行同步操作，否则在输出的图像的时候会出现错误，原因是线程里的数据肯定是不对的，或者是还没有写进去就已经输出出来，共享内存里的数据有些是之前没有修改前的数据

那么来看一看代码，之前有在别的博客里写过的就不再写了。虽然我学习的进度有点慢，还是要抓紧时间的

#include "cuda.h"
#include "../common/book.h"
#include "../common/cpu_bitmap.h"

#define DIM 1024
#define PI 3.1415926535897932f

__global__ void kernel( unsigned char *ptr ) {
// map from threadIdx/BlockIdx to pixel position
int x = threadIdx.x + blockIdx.x * blockDim.x;
int y = threadIdx.y + blockIdx.y * blockDim.y;
int offset = x + y * blockDim.x * gridDim.x;

这里共享的内存是一个二维16*16大小的数组，也就是说下面程序里定义的每个线

最低0.47元/天解锁文章

ElegantIce

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
基于共享内存的位图——GPU高性能编程CUDA实战5.3.3

当对一个线程块里的线程数据进行同时输出的时候，这个实验室输出了一个图像，需要进行同步操作，否则在输出的图像的时候会出现错误，原因是线程里的数据肯定是不对的，或者是还没有写进去就已经输出出来，共享内存里的数据有些是之前没有修改前的数据那么来看一看代码，之前有在别的博客里写过的就不再写了。虽然我学习的进度有点慢，还是要抓紧时间的#include "cuda.h"#include "..
复制链接

扫一扫

专栏目录