待解决。
函数调用如下:
dim3 dimBlock(THREADSIZE);
dim3 dimGrid((m+dimBlock.x-1)/dimBlock.x);
mv_kernel<<<dimGrid, dimBlock>>>
在mv_kernel函数中,使用
int row = blockIdx.x * blockDim.x + threadIdx.x;
和使用
int row = blockIdx.x + threadIdx.x;
得到的效果是一样的!!!
什么原因呢?
对于上述dimBlock,dimGrid,得出的blockDim.x的大小是1么??