1.cuda程序简介
cuda是nvidia公司推出的为了提高计算性能在GPU上执行快速运算的工具,由于要使用GPU进行运算,因此我们在程序执行时,要兼顾CPU和GPU上的数据共享。本节只讨论最简单的两个数相加的程序。
2.cuda代码
#include<iostream>
#include<cstdlib>
using namespace std;
#define N 1
__global__ void add(int *a,int *b,int *c) {
*c = *a + *b;
}
int main() {
int a,b,c;
a=1;
b=9;
int *d_a,*d_b,*d_c;
/* allocate memory on device */
cudaMalloc((void **)&d_a,N*sizeof(int));
cudaMalloc((void **)&d_b,N*sizeof(int));
cudaMalloc((void **)&d_c,N*sizeof(int));
cudaMemcpy(d_a,&a,N*sizeof(int),cudaMemcpyHostToDevice);
cudaMemcpy(d_b,&b,N*sizeof(int),cudaMemcpyHostToDevice);
add<<<1,1>>>(d_a,d_b,d_c);
cudaMemcpy(&c,d_c,N*sizeof(int),cudaMemcpyDeviceToHost);
cout<<"c:"<<c<<endl;
cudaFree(d_a);
cudaFree(d_b);
cudaFree(d_c);
return 0;
}