cudaMalloc与cudaMemcpy详解

#include<stdio.h>

__global__ void use_global_memory_GPU(float* array){
    array[threadIdx.x] = 2.0f * (float) threadIdx.x;
    if(threadIdx.x<10){
        printf("array[%d]: %f\n", threadIdx.x, array[threadIdx.x]);
    }
}

int main(){
    float h_arr[128];
    float* d_arr;  // d_arr的内容是一个地址,指向的是float,d_arr有自己的地址

    cudaMalloc((void**) &d_arr, sizeof(float)*128);  // &d_arr是d_arr的地址,类型是float**。(void**)&d_arr就是将其强制转换为void**,表示指向指针的指针,即:a保存一个位置类型的地址,a的地址
    // cudaMalloc会接收d_arr的地址,从而能够直接修改指针d_arr,使其指向新分配的设备内存。上面这行运行完之后,d_arr将指向CUDA设备的内存,而不是主机内存
    // 所谓的“d_arr将指向CUDA设备的内存”,也就是d_arr中存放的是cudaMalloc在显存上分配的数组地址
    cudaMemcpy((void*) d_arr, (void*)h_arr, sizeof(float)*128, cudaMemcpyHostToDevice);  // 强制转换为void*,void*就是一个通用指针类型,可以指向任何数据类型
    // d_arr是指针,d_arr表示的是cuda数组第一个元素的位置
    // h_arr表示CPU上的数组第一个元素的位置。cudaMemcpy就是从两个位置开始,一个个往后进行复制

    // 上面两个都是同样的道理,要修改指针的内容(即指针中存放的地址),就要传入指针的地址,即&d_arr;
    // 若要修改指针指向地址的内容,即指针是数组首址、修改数组的内容,就要传入数组的地址,即指针,即d_arr

    // &是取地址运算符,用于获取变量的内存地址。如int x=10; int *p=&x; 中,&x返回变量x的地址并将其存储在指针p中
    // *是解引用运算符,用于获取指针变量所指向的值。如int y=*p; 中,*p将获取指针p指向的地址中的值,并将其赋给y

    use_global_memory_GPU<<<1, 128>>>(d_arr);

    cudaMemcpy((void*) h_arr, (void*) d_arr, sizeof(float)*128, cudaMemcpyDeviceToHost);

}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值