1. 在device上分配内存的cudaMalloc函数
在device上申请一定字节大小的显存,其中devPtr是指向所分配内存的指针
cudaError_t cudaMalloc(void** devPtr, size_t size);
2. 释放内存使用cudaFree函数
3. 负责host和device之间数据通信的cudaMemcpy函数
cudaError_t cudaMemcpy(void* dst, const void* src, size_t count, cudaMemcpyKind kind)
其中src指向数据源,而dst是目标区域,count是复制的字节数,其中kind控制复制的方向,cudaMemcpyHostToHost, cudaMemcpyHostToDevice, cudaMemcpyDeviceToHost及cudaMemcpyDeviceToDevice,如cudaMemcpyHostToDevice将host上数据拷贝到device上。