cuda编程学习——第一个cuda程序！干货向（一）

出门吃三碗饭

已于 2023-09-27 20:58:53 修改

阅读量844

点赞数 1

分类专栏： CUDA编程文章标签：学习 cuda 入门

于 2023-05-18 18:35:08 首次发布

本文链接：https://blog.csdn.net/qq_40514113/article/details/130752967

版权

CUDA编程专栏收录该内容

6 篇文章 4 订阅

订阅专栏

前言：

最近在做三维重建，尤其是Nerf方面多视角合成工作的时候，意识到了cuda的编程计算可以大大提高其中渲染的计算，最明显的例子是Instant-ngp，Plenoxels等文章，因此后面会学Cuda一段时间，同时也就开了这个新坑。
因为笔者也是cuda新手，所以大家有问题的话可以评论区指出，一起学习进步！

我已经更新了我的Github仓库，大家可以前往仓库下载代码
我的CUDA学习仓库
在这里插入图片描述

Nvidia Cuda官方入门资料

运行环境：

Windows10，Visual Studio2019,显卡3050Ti
（大家自行根据自己笔记本情况去配环境，或者没有gpu，租借云服务器去学习也是可以的）

（1）cuda程序

步骤分析：
1：调用显卡设备
2：分配显存空间，也就是GPU空间
3：分配CPU空间
4：把CPU上的数据拷贝到分配好的GPU空间上
5：在GPU上进行计算，执行核函数 kernel
6：把计算结果从GPU拷贝到CPU空间上
7：把CPU上拷贝好的数据输出
8：工作完成，释放cpu，gpu空间

#include<stdint.h>
#include<cuda.h>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>

//定义核函数, 在host调用， device上计算, 该函数作用为把空间幅值为1
__global__ void kernel(float* a)
{
	a[threadIdx.x] = 1;

}
int main(int argc, char** argv)
{
	// 设置使用的显卡设备  cpu用 host表示  gpu用device表示
	cudaSetDevice(0);
	//分配显存空间  dx  表示 device 上的空间x
	float* dx;
	cudaMalloc((void**)&dx, 16 * sizeof(float));
	//分配cpu内存空间
	float hx[16] = { 0 };
	//把cpu上的数据拷贝到gpu device 上
	cudaMemcpy(dx, hx, 16 * sizeof(float), cudaMemcpyHostToDevice);
	kernel << <1, 16 >> > (dx);
	//把gpu上的数据，计算结果，拷贝到cpu host 上
	cudaMemcpy(hx, dx, 16 * sizeof(float), cudaMemcpyDeviceToHost);
	for (int i = 0; i < 16; i++)
	{
		printf("%f \n", hx[i]);
	}
	//释放资源 分别释放 显存和内存空间
	cudaFree(dx);
	free(hx);
//	cudaDeviceReset();
	return 0;
}

出门吃三碗饭

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
cuda编程学习——第一个cuda程序！干货向（一）

最近在做三维重建，尤其是Nerf方面多视角合成工作的时候，意识到了cuda的编程计算可以大大提高其中渲染的计算，最明显的例子是Instant-ngp，Plenoxels等文章，因此后面会学Cuda一段时间，同时也就开了这个新坑。因为笔者也是cuda新手，所以大家有问题的话可以评论区指出，一起学习进步！
复制链接

扫一扫