cuda 编程可以通过 C/C++ 使用 GPU,使用 cuda 编程首先确保要有 cuda 环境,
但是使用时不能直接操作 gpu 数据,只能得到 gpu 上的一个指针,再把数据拷贝到对应位置。
具体使用
使用 cmake 构建项目可以使用宏
#ifdef USE_CUDA
#endif
添加头文件
#ifdef USE_CUDA
#include "cuda_runtime.h"
#endif
cudaMalloc 申请 GPU 内存
uint8_t *dst;
cudaMalloc((void **)&dst, bytes);
cudaMemcpy 拷贝
cudaMemcpy(gpu_data, src, bytes, cudaMemcpyHostToDevice);
cudaMemcpyHostToDevice 内存 To 显存
cudaMemcpyDeviceToHost 显存 To 内存
cudaMemcpyDeviceToDevice 内存 To 显存
cudaMemcpyHostToHost 内存 To 内存
cudaFree 释放 GPU 内存
cudaFree(dst);
返回值
assert(返回值 == cudaSuccess)
保证cudaMalloc 和 cudaMemcpy 的成功。