环境:win7_64 VS2010 CUDA6.0 VAX Quadro410
安装配置CUDA环境,这里就不详细介绍了。
一、手动建立CUDA工程
打开VS2010,新建空白项目,起名为 test2。
在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0
添加头文件 t.h,注意这里t.cuh,也是可以的,但是为了外观上等同于纯C\C++类库,写成.h
添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。
这样一个手动建立的CUDA工程就配置好了。
二、建立CUDA类库,并生成dll
在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容如下:
#ifndef _TEST2_H
#define _TEST2_H//防御重复编译
#ifdef _DLLEXPORTING//dll到处符号宏定义
#define TEST2_DLLDECL __declspec(dllexport)
#else
#define TEST2_DLLDECL __declspec(dllimport)
#endif
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
//这两个头文件是CUDA必备,但是你右键->打开文档“”的时候VS却不能找到。不需要你手动设置路径,只需要在 右键工程->生成自定义 中,选择CUDA,VS即可自动找到包含路径
#include
__global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能作为类库外部接口
cudaError_t TEST2_DLLDECL addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,作为dll的接口供外部调用。
2.在t.cu中写入两个函数的实现,如下:
#include "t.h"
__global__ void addKernel(int *c, const int *a, const int *b)
{
int i = threadIdx.x;
c[i] = a[i] + b[i];
}
cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size)
{
//其他代码省略
addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
//其他代码省略
return cudaStatus;
}
3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING
4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件
三、普通C++工程调用CUDA类库dll
在相同解决方案中新建工程,在工程属性中,链接器,常规,附加库目录,添加上一步生成的lib所在的目录;在链接器,输入,附加依赖项,添加test2.lib;保证你生成的exe和dll在同一目录下。
工程,右键,生成自定义,选择CUDA
虽然CUDA编译器参与了生成过程,但是这个工程就是普通的C、C++工程, 自身使用VC编译器,你只需要添加#include“..\\test2\\test2.h”就行了