CUDA学习（一）：计算立方

最新推荐文章于 2024-04-24 15:08:33 发布

IT猿手

最新推荐文章于 2024-04-24 15:08:33 发布

阅读量444

点赞数 2

分类专栏： cuda编程文章标签： c++ 算法 c语言

本文链接：https://blog.csdn.net/weixin_46204734/article/details/113882153

版权

cuda编程专栏收录该内容

3 篇文章 0 订阅

订阅专栏

cuda编程

VS2019+GPU

需要引入
在这里插入图片描述

再右键打开的项目–>生成依赖项–>生成自定义–>勾选CUDA v10.1。
在这里插入图片描述
再右键.cu文件–>文件属性设置为 CUDA c/c++

计算0到255的立方

“kernel.cu”

#include "cuda_runtime.h"  
#include "device_launch_parameters.h"  

__global__ void add(const int* a, const int* b, int* c, int size)
{
	int tid = threadIdx.x + blockIdx.x * blockDim.x;
	c[tid] = b[tid] *a[tid];
}

extern "C" void addKernel(const int* a, const int* b, int* c, int size)
{
	int* dev_a = 0;
	int* dev_b = 0;
	int* dev_c = 0;

	cudaSetDevice(0);
	cudaMalloc((void**)&dev_a, sizeof(int) * size);
	cudaMalloc((void**)&dev_b, sizeof(int) * size);
	cudaMalloc((void**)&dev_c, sizeof(int) * size);
	cudaMemcpy(dev_a, a, sizeof(int) * size, cudaMemcpyHostToDevice);
	cudaMemcpy(dev_b, b, sizeof(int) * size, cudaMemcpyHostToDevice);
	cudaMemcpy(dev_c, c, sizeof(int) * size, cudaMemcpyHostToDevice);

	add << <2, 128 >> > (dev_a, dev_b, dev_c, size);

	cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost);

	cudaFree(dev_a);
	cudaFree(dev_b);
	cudaFree(dev_c);
}

“main.cpp”

#include <stdio.h>  
#include <stdlib.h>  
//#include "kernel.cu"  

#define N 256
extern "C" void addKernel(const int* a, const int* b, int* c, int size);

int main(int argc, char** argv)
{
	int a[N];
	int b[N];
	int c[N];

	for (int i = 0; i < N; i++)
	{
		a[i] = i;
		b[i] = i * i;
		c[i] = 0;
	}
	addKernel(a, b, c, N);
	for (int i = 0; i < N; i++)
	{
		printf("%d^3=%d\n", i, c[i]);
	}
	return 0;
}

结果如下
在这里插入图片描述
.
.
.

参考一
 参考二

IT猿手

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA学习（一）：计算立方

cuda编程VS2019+GPU需要引入再右键打开的项目–>生成依赖项–>生成自定义–>勾选CUDA v10.1。再右键.cu文件–>文件属性设置为 CUDA c/c++计算0到255的立方“kernel.cu”#include "cuda_runtime.h" #include "device_launch_parameters.h" __global__ void add(const int* a, const int* b, int* c, int
复制链接

扫一扫