需要包含的头文件有:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
指定设备
cudaStatus = cudaSetDevice(0);
查询设备信息
核函数前缀
__global__
内存分配 和 释放
cudaStatus = cudaMalloc((void**)&dev_c, size * sizeof(int));
cudaFree(dev_c);
在主机和设备之间 拷贝内存数据
cudaStatus = cudaMemcpy(dev_a, a, size * sizeof(int), cudaMemcpyHostToDevice);
cudaStatus = cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost);
等待
cudaStatus = cudaDeviceSynchronize();
重置
cudaStatus = cudaDeviceReset();