《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和

使用线程实现GPU上的矢量求和

//**************使用线程实现GPU上的矢量求和**********//
/* 				时间:2017-8-9
				参考书:《GPU高性能编程CUDA实战》	*/
#include <iostream>
#include <stdio.h>

#define N 10

using namespace std;

__global__ void add(int *a,int *b,int *c);

int main()
{
	int a[N],b[N],c[N];
	int *dev_a,*dev_b,*dev_c;

	//在GPU上分配内存
	cudaMalloc((void**)&dev_a,N*sizeof(int));
	cudaMalloc((void**)&dev_b,N*sizeof(int));
	cudaMalloc((void**)&dev_c,N*sizeof(int));

	//在CPU上为数组"a""b"赋值
	for(int i=0;i<N;i++)
	{
		a[i]=i;
		b[i]=i*i;
	}

	//将数组“a”"b"复制到GPU
	cudaMemcpy(dev_a,a,N*sizeof(int),cudaMemcpyHostToDevice);
	cudaMemcpy(dev_b,b,N*sizeof(int),cudaMemcpyHostToDevice);

	add<<< 1,N>>>(dev_a,dev_b,dev_c);

	//将数组“c”从GPU赋值到CPU
	cudaMemcpy(c,dev_c,N*sizeof(int),cudaMemcpyDeviceToHost);

	//显示结果
	for(int i=0;i<N;i++)
	{
		printf("%d + %d = %d\n",a[i],b[i],c[i]);
	}

	//释放在GPU上分配的内存
	cudaFree(dev_a);
	cudaFree(dev_b);
	cudaFree(dev_c);

	return 0;
}

__global__ void add(int *a,int *b,int *c)
{
	int tid=threadIdx.x;
	if(tid<N)
	{
		c[tid]=a[tid]+b[tid];
	}
}


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值