一、环境
- win10
- VS2022
- python39
- pybind11最新版git下载源码,后边会用:https://github.com/pybind/pybind11
- 同时通过pip install pybind11,python环境下也要安装
- cuda环境配置参考:https://zhuanlan.zhihu.com/p/488518526
二、cuda核函数动态库生成
步骤一:创建cuda项目
创建成功后,会进入一个默认核函数,如下图所示:
点击运行后会输出如下图结果,表明环境配置成功
步骤二:清空步骤一中默认的事例代码,然后自定义核函数,具体如下
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include "stdio.h"
#include "File.cuh" //注意包括这个头文件
//CUDA核函数
__global__ void addKernel(double* c, const double* a, const double* b)
{
int i = threadIdx.x;
c[i] = a[i] + b[i];
}
// 向量相加
void vectorAdd(double c[], double a[], double b[],int size)
{
double* dev_a = 0;
double* dev_b = 0;
double* dev_c = 0;
// 在GPU中为变量dev_a、dev_b、dev_c分配内存空间.
cudaMalloc((void**)&dev_c, size * sizeof(double));