编写CUDA程序经验教训
1.在编写cuda程序时,不管是在cpu还是gpu执行的代码,所有n维数组均用cudaMalloc/malloc开辟一维空间,通过 [行号*列数+列号] 来获取其值。
慎用:cudaMallocPitch、cudaMemset2D、cudaMemcpy2D
这一套二维数组相关函数,因为这套函数的对齐操作会导致矩阵旋转操作中结果有误。
2.注意:线程函数里,在指针变化时,禁止用 += -= 这种运算!!!
3.注意:列向量、行向量 都用 一维数组 表示。
3.在编写cuda程序时,不管是在cpu还是gpu执行的代码,所有n维数组均有cudaMalloc/malloc
开辟一维空间,通过 [行号*列数+列号] 来获取其值