CDUA 图形学 Surface Object实验

最新推荐文章于 2024-11-13 13:33:50 发布

lvxiangyu11

最新推荐文章于 2024-11-13 13:33:50 发布

阅读量886

点赞数

分类专栏：计算机图形学图形渲染学 CUDA 并行计算

本文链接：https://blog.csdn.net/lvxiangyu11/article/details/88096587

版权

并行计算同时被 3 个专栏收录

9 篇文章

订阅专栏

CUDA

6 篇文章

订阅专栏

计算机图形学

4 篇文章

订阅专栏

本文介绍了一个基于CUDA的Surface Object实验，代码源自CUDA编程指南，适用于VS2017和CUDA10，针对GTX1060进行优化。实验通过复制函数内核展示Surface Object在GPU内存操作中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

下面是对Surfance Object的实验，代码改自 CUDA C PROGRAMMING GUIDE (PG-02829-001_v10.0 | October 2018) p54，因为这里比较贴近计算机图形学，故移到图形学中去。

/*
	下面是对CUDA的surface object的实验，实验环境VS2017,CUDA 10，GTX 1060。
	作者：吕翔宇，部分代码改自CUDA手册
	E-mail:630056108@qq.com
	2019.3.4 0:11

*/
#define __cplusplus
#define __CUDACC__

#include<cuda.h>
#include<iostream>
#include<cmath>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"

//定义简单表层对象的复制函数内核
__global__ void copyKernel(//忽略VS2017对global的警告，因为CUDACC定义使头文件互相影响，编译可过
	cudaSurfaceObject_t inputSurfObj,cudaSurfaceObject_t outputSurfObj,
	int width, int height) {
	//计算表层位置
	unsigned int x = blockIdx.x*blockDim.x + threadIdx.x;
	unsigned int y = blockIdx.y*blockDim.y + threadIdx.y;
	if (x < width && y < height) {
		uchar4 data;
		//从输入表层读入
		surf2Dread(&data, inputSurfObj, x * 4, y);
		//将数据写入到表层中
		surf2Dwrite(data, outputSurfObj, x * 4, y);
	}

}

int main() {
	std::ios::sync_with_stdio(false);//习惯性关闭同步流，看不懂的请忽略。
	//注意这里使用cudaChannelFormatKindUnsigned，即处理的是unsigned int
	//准备实验参数
	const int width = 16;
	const int height = 16;
	const size_t size = sizeof(unsigned int)*width*height;
	unsigned int *h_data;
	h_data = (int unsigned*)malloc(size);
	//init
	std::cout << "初始数据：\n";
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			h_data[i*width + j] = rand() % 100;
			std::cout << h_data[i*width + j]<<"\t";
		}
		std::cout << "\n";
	}

	//设备端分配CUDA数组
	cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc(8, 8, 8, 8, cudaChannelFormatKindUnsigned);
	cudaArray *cuInputArray;
	cudaMallocArray(&cuInputArray, &channelDesc, width, height, cudaArraySurfaceLoadStore);
	cudaArray *cuOutputArray;
	cudaMallocArray(&cuOutputArray, &channelDesc, width, height, cudaArraySurfaceLoadStore);

	//搬运内存
	cudaMemcpyToArray(cuInputArray, 0, 0, h_data, size, cudaMemcpyHostToDevice);

	//设置表层纹理
	struct cudaResourceDesc resDesc;
	memset(&resDesc, 0, sizeof(resDesc));
	resDesc.resType = cudaResourceTypeArray;
	
	//创建表层对象
	resDesc.res.array.array = cuInputArray;//设置纹理绑定位置
	cudaSurfaceObject_t inputSurfObj = 0;
	cudaCreateSurfaceObject(&inputSurfObj, &resDesc);//创建输入纹理对象
	resDesc.res.array.array = cuOutputArray;
	cudaSurfaceObject_t outputSurfObj = 0;
	cudaCreateSurfaceObject(&outputSurfObj, &resDesc);//创建输出纹理对象

	//定义内核参数
	dim3 dimBlock(16, 16);
	dim3 dimGrid(
			(width + dimBlock.x - 1) / dimBlock.x,
			(height+dimBlock.y-1)/dimBlock.y
		);

	copyKernel <<<dimGrid, dimBlock >>> (inputSurfObj, outputSurfObj, width, height);

	//销毁表层对象
	cudaDestroySurfaceObject(inputSurfObj);
	cudaDestroySurfaceObject(outputSurfObj);

	//输出结果
	memset(h_data, 0, size);
	//cudaMemcpyFromArray(h_data, cuOutputArray, 0, 0, size, cudaMemcpyDeviceToHost);
	cudaMemcpy(h_data, cuOutputArray, size, cudaMemcpyDeviceToHost);
	std::cout << "处理后数据：\n";
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			h_data[i*width + j] = rand() % 10;
			std::cout << h_data[i*width + j] << "\t";
		}
		std::cout << "\n";
	}

	//释放设备内存
	cudaFreeArray(cuInputArray);
	cudaFreeArray(cuOutputArray);
	free(h_data);

	system("pause");
	return 0;
}

结果