cudaMemcpy学习笔记_cudamemcpy3dparms-CSDN博客

本文链接：https://blog.csdn.net/jacke121/article/details/126079967

主机是电脑Host

Device是gpu设备。

cudaMemcpy用于在主机（Host）和设备（Device）之间往返的传递数据，用法如下：

主机到设备：cudaMemcpy(d_A,h_A,nBytes,cudaMemcpyHostToDevice)

设备到主机：cudaMemcpy(h_A,d_A,nBytes,cudaMemcpyDeviceToHost)

注意：该函数是同步执行函数，在未完成数据的转移操作之前会锁死并一直占有CPU进程的控制权，所以不用再添加cudaDeviceSynchronize()函数

示例：

void VectorReal_copyBuffer(realVecHandle* addr, float hostArr[],long buffer, bool tohost, int copyMode) 
{ 
    realVecHandle * native =addr;
    float * host  = hostArr;

if ( copyMode == 0 ) {
    if (!tohost) {
        cudaMemcpy( native->data,host, native->size, cudaMemcpyHostToDevice) ;
    } else {
        cudaMemcpy( host, native->data, native->size, cudaMemcpyDeviceToHost) ;
    }
}
}

//显存上分配空间

CUDA_SAFE_CALL(cudaMalloc((void**)&Dst_d,sizeof(float3) * totalPNum));

//显存上传输数据

CUDA_SAFE_CALL(cudaMemcpy(Dst_d, Srcdata0_h, sizeof(float3) * numdata0, cudaMemcpyHostToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0, Srcdata1_d, sizeof(float3) * numdata1, cudaMemcpyDeviceToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0 + numpoint1, Srcdata2_d, sizeof(float3) * numdata2, cudaMemcpyDeviceToDevice));

数据传输过程中，目的地址在源地址之前（地址可能有偏移计算，数据源不同目的相同时），对应后面参数，devicetohost 或者 hosttodevice.

原文链接：https://blog.csdn.net/xiaoheibaqi/article/details/44001273