在做GPU(CUDA)高性能计算时遇到一个问题:__host__中分配的GPU变量怎么在__host__间传递。其实这转换过来是一个函数间指针型变量的传参问题。
指针本身也是一个变量,里边存储的是地址,如果需要在函数间传递可修改自身地址的指针(指针型变量),那么有两种方法实现。
直接传递
取该指针的地址,作为一个新的指针传递。
如 A()中有 double * T,需要传参到B()中,并且可修改T的地址。
void A(){
double *T;
B(&T);
}
void B(double **T){
double *tmp = new double[10];
*T = tmp; //T的地址变为tmp的地址,A中的也一起改变。
/*CUDA分配GPU内存,如下
cudaMalloc((void **)T,10*sizeof(double));
*/
}
间接转换
间接转换的方法,是将地址作为一段数据来传递。地址是一串表示位置的数,那么可以用无符号的整形来保存,然后在函数间传递。(CUDA分配的内存地址可能会超过4字节,所以建议用unsigned long 保存地址)。
void A(){
unsigned long p=0;
B(&p);
double *T;
T = (double *)p;
}
void B(unsigned long *p){
double *tmp = new double[10];
*p = (unsigned long)tmp; //创建一列double数组,用unsigned long 保存首地址
/*CUDA分配GPU内存,如下
double *tmp;
cudaMalloc((void **)&tmp,10*sizeof(double));
*p = (unsigned long)tmp;
*/
}