编写CUDA常用宏定义
#define一个报错宏
我们知道CUDA函数几乎都有一个返回值,它们都是表示CUDA函数执行是否成功的变量。比如runtime API函数的返回值一般是
cudaError_t
cublas库函数的返回值一般是
cublasHandle_t
我们就可以根据这些返回值来知道函数执行是否成功,若错误,则通过一些系统宏定义来输出错误的位置在哪一个文件的哪一行
下面为宏的内容:
#define CHECK_CUDA(errorInfo,cudaSuccInfo){ \
if((errorInfo)!=cudaSuccInfo){ \
fprintf(stderr,"CUDA error in line %d of file %s\:%s\n",__LINE__, __FILE__, cudaGetErrorString(cudaGetLastError()));\
system("pause");\
exit(-1);\
}\
} \
这个宏需要传入两个参数,第一个是CUDA函数的返回值,第二个是对应函数执行成功应返回的成功宏。当程序中用了CUDA的一些库的话,可以定义一个宏调用它,代码就不会那么冗长。如:
#define RUNTIME_CUDA_ERROR(errorInfo) CHECK_CUDA(errorInfo,cudaSuccess) //runtime API函数
#define CUBLAS_CUDA_ERROR(errorInfo) CHECK_CUDA(errorInfo,CUBLAS_STATUS_SUCCESS) //cuBlas API函数
#define CUDA释放空间宏
我们知道要对CUDA申请的设备内存进行释放需要调用cudaFree()
函数,在调用之前,我们要先判断设备指针是否为空,防止重复释放,释放完我们需要将其设置为空指针,以防止出现野指针。也就是我们要
if(d_ptr!=nullptr)cudaFree(d_ptr);d_ptr=nullptr;
当设备指针多了之后,每次都要重复写,显得麻烦,代码又不简洁。
所以,我们直接定义一个宏
#define CUDA_FREE(d_ptr){ \
if (d_ptr != nullptr)RUNTIME_CUDA_ERROR(cudaFree(d_ptr)); d_ptr = nullptr;\
}\