一个用GPU写的数组之间的求和

最新推荐文章于 2023-09-19 16:03:36 发布

波雅_汉库克

最新推荐文章于 2023-09-19 16:03:36 发布

阅读量544

点赞数

分类专栏： CUDA C

本文链接：https://blog.csdn.net/m0_38036750/article/details/99709453

版权

CUDA C 专栏收录该内容

29 篇文章 3 订阅

订阅专栏

代码说明:

输入一个数,这个数就是数组的长度,和之前的数组求和不同,这个是一个数组之间的求个,例如a[10];求这10个数的和.代码会随机产生n个数.然后求出这n个数的和.

代码思路很简单:就是

运行结果:

代码:

#include <cuda_runtime.h>
#include <iostream>
#include <stdlib.h>
#include <time.h>

__global__ void add(int * d_a,int *d_b,int n)
{
	int idx = threadIdx.x;
	int i = 2,j = 1;

	do{
		if(idx % i == 0)
		d_a[idx] += d_a[idx + j];
		i *= 2;
		j *= 2;
	}while(n/=2);
	d_b[0] = d_a[0];

}
int main()
{
	int blag = 1;
	int n = 0;
	do{
		std::cout << "请输入数据长度:" << std::endl;
		std::cin >> n;
		if(n <= 0)
		{
			std::cout << "你输入的数据长度不合法,请重新输入!" << std::endl;
		}else{
			blag = 0;
		}
	}while(blag);

	srand(time(NULL));

	int *h_a = (int*)malloc(sizeof(int) * n);
	int *h_b = (int*)malloc(sizeof(int));
	for(int i = 0; i < n; ++i)
	{
		h_a[i] = rand() % 11;
		printf("h_a[%d] = %d\t",i,h_a[i]);
	}
	printf("\n");

	int *d_a = NULL;
	int *d_b = NULL;
	cudaMalloc((void**)&d_a,sizeof(int) * n);
	cudaMalloc((void**)&d_b,sizeof(int));

	cudaMemcpy(d_a,h_a,sizeof(int) * n,cudaMemcpyHostToDevice);

	add<<<1,n>>>(d_a,d_b,n);
	cudaMemcpy(h_b,d_b,sizeof(int),cudaMemcpyDeviceToHost);

	printf("h_b = %d\n",*h_b);

	free(h_a);
	free(h_b);
	cudaFree(d_a);
	cudaFree(d_b);

	printf("运行结束!\n");
	return 0;
}