cudaMalloc与cudaMemcpy详解

rebekk

于 2024-09-29 00:06:28 发布

阅读量95

点赞数 1

分类专栏： cuda编程文章标签： cuda

本文链接：https://blog.csdn.net/qq_43527718/article/details/142624307

版权

cuda编程专栏收录该内容

1 篇文章 0 订阅

订阅专栏

#include<stdio.h>

__global__ void use_global_memory_GPU(float* array){
    array[threadIdx.x] = 2.0f * (float) threadIdx.x;
    if(threadIdx.x<10){
        printf("array[%d]: %f\n", threadIdx.x, array[threadIdx.x]);
    }
}

int main(){
    float h_arr[128];
    float* d_arr;  // d_arr的内容是一个地址，指向的是float，d_arr有自己的地址

    cudaMalloc((void**) &d_arr, sizeof(float)*128);  // &d_arr是d_arr的地址，类型是float**。(void**)&d_arr就是将其强制转换为void**，表示指向指针的指针，即：a保存一个位置类型的地址，a的地址
    // cudaMalloc会接收d_arr的地址，从而能够直接修改指针d_arr，使其指向新分配的设备内存。上面这行运行完之后，d_arr将指向CUDA设备的内存，而不是主机内存
    // 所谓的“d_arr将指向CUDA设备的内存”，也就是d_arr中存放的是cudaMalloc在显存上分配的数组地址
    cudaMemcpy((void*) d_arr, (void*)h_arr, sizeof(float)*128, cudaMemcpyHostToDevice);  // 强制转换为void*，void*就是一个通用指针类型，可以指向任何数据类型
    // d_arr是指针，d_arr表示的是cuda数组第一个元素的位置
    // h_arr表示CPU上的数组第一个元素的位置。cudaMemcpy就是从两个位置开始，一个个往后进行复制

    // 上面两个都是同样的道理，要修改指针的内容（即指针中存放的地址），就要传入指针的地址，即&d_arr；
    // 若要修改指针指向地址的内容，即指针是数组首址、修改数组的内容，就要传入数组的地址，即指针，即d_arr

    // &是取地址运算符，用于获取变量的内存地址。如int x=10; int *p=&x; 中，&x返回变量x的地址并将其存储在指针p中
    // *是解引用运算符，用于获取指针变量所指向的值。如int y=*p; 中，*p将获取指针p指向的地址中的值，并将其赋给y

    use_global_memory_GPU<<<1, 128>>>(d_arr);

    cudaMemcpy((void*) h_arr, (void*) d_arr, sizeof(float)*128, cudaMemcpyDeviceToHost);

}