摘要:本文论述了使用CUDA C编写Windows Console Application、动态链接库(DLL)、在 .NET 中使用CUDA C编写的DLL的基本方法。
1、 CUDA C编写Windows Console Application
下面我们从一个简单的例子开始学习CUDA C。
打开VS,新建一个CUDAWinApp项目,项目名称为Vector,解决方案名称为CUDADemo。依次点击“确定”,“下一步”,选择Empty project。点击“Finished”。这样一个CUDA的项目就建成了。
右键点击Vector项目,依次选择“添加”、“新建项”、“代码”、“CUDA”。在名称中输入要添加的文件名。如Vector.cu。然后点击添加。
下面在Vector.cu文件里实现两个向量相加的程序。
//添加系统库
#include <stdio.h>
#include <stdlib.h>
//添加CUDA支持
#include <cuda.h>
__global__ void VecAdd(float *A, float *B, float *C);
__host__ void runVecAdd(int argc, char **argv);
int main(int argc, char **argv)
{
runVecAdd(argc,argv);
CUT_EXIT(argc,argv);
}
__host__ void runVecAdd(int argc,char **argv)
{//初始化host端内存数据
const unsigned int N = 8;//向量维数
const unsigned int memSize = sizeof(float)*N;//需要空间的字节数
float *h_A = (float*)malloc(memSize);
float *h_B = (float*)malloc(memSize);
float *h_C = (float*)malloc(memSize);
for (unsigned int i = 0; i < N; i++)
{h_A[i] = i;h_B[i] = i;}
//设备端显存空间
float *d_A, *d_B, *d_C;
//初始化Device
CUT_DEVICE_INIT(argc,argv);
CUDA_SAFE_CALL(cudaMalloc((void**)&d_A, memSize));
CUDA_SAFE_CALL(cudaMalloc((void**)&d_B, memSize));
CUDA_SAFE_CALL(cudaMalloc((void**)&d_C, memSize));
CUDA_SAFE_CALL(cudaMemcpy(d_A, h_A, memSize, cudaMemcpyHostToDevice));
CUDA_SAFE_CALL(cudaMemcpy(d_B, h_B, memSize, cudaMemcpyHostToDevice));
VecAdd<<<1,N,memSize>>>(d_A, d_B, d_C);
CUT_CHECK_ERROR("Kernel execution failed");
CUDA_SAFE_CALL(cudaMemcpy(h_C, d_C, memSize, cudaMemcpyDeviceToHost));
for (unsigned int i = 0