#include<stdio.h>
__global__ void use_global_memory_GPU(float* array){
array[threadIdx.x] = 2.0f * (float) threadIdx.x;
if(threadIdx.x<10){
printf("array[%d]: %f\n", threadIdx.x, array[threadIdx.x]);
}
}
int main(){
float h_arr[128];
float* d_arr; // d_arr的内容是一个地址,指向的是float,d_arr有自己的地址
cudaMalloc((void**) &d_arr, sizeof(float)*128); // &d_arr是d_arr的地址,类型是float**。(void**)&d_arr就是将其强制转换为void**,表示指向指针的指针,即:a保存一个位置类型的地址,a的地址
// cudaMalloc会接收d_arr的地址,从而能够直接修改指针d_arr,使其指向新分配的设备内存。上面这行运行完之后,d_arr将指向CUDA设备的内存,而不是主机内存
// 所谓的“d_arr将指向CUDA设备的内存”,也就是d_arr中存放的是cudaMalloc在显存上分配的数组地址
cudaMemcpy((void*) d_arr, (void*)h_arr, sizeof(float)*128, cudaMemcpyHostToDevice); // 强制转换为void*,void*就是一个通用指针类型,可以指向任何数据类型
// d_arr是指针,d_arr表示的是cuda数组第一个元素的位置
// h_arr表示CPU上的数组第一个元素的位置。cudaMemcpy就是从两个位置开始,一个个往后进行复制
// 上面两个都是同样的道理,要修改指针的内容(即指针中存放的地址),就要传入指针的地址,即&d_arr;
// 若要修改指针指向地址的内容,即指针是数组首址、修改数组的内容,就要传入数组的地址,即指针,即d_arr
// &是取地址运算符,用于获取变量的内存地址。如int x=10; int *p=&x; 中,&x返回变量x的地址并将其存储在指针p中
// *是解引用运算符,用于获取指针变量所指向的值。如int y=*p; 中,*p将获取指针p指向的地址中的值,并将其赋给y
use_global_memory_GPU<<<1, 128>>>(d_arr);
cudaMemcpy((void*) h_arr, (void*) d_arr, sizeof(float)*128, cudaMemcpyDeviceToHost);
}
10-21
1万+
09-30
07-28