首先我们知道在日常计算中都是十进制的,42=4×10+2。
如果将阶的升序列反转,那么42可以表示为24,也就是个位=2, 十位=4。
一个三维数组array=[10, 10, 1], 那么第42个数就是 item[1, 4, 1].
范化一下 array=[X, Y], 那么第index 个数就是item [x, y] . index= y*X + x;
从二维发展到三维就是
array=[X, Y, Z], 第一次的y_index=z*Y+y; 第二次的x_index = y_index * X + x;
合并后:
index = (z*Y + y) * X +x;
更高维度的只要递归的进行上面的计算就可以了。
回到CUDA的组织方面 Grid是一个三维网格,网格元素是Block, Block是一个元素为thread的三维网格,最后级联组织在一起就是一个六维的数组而已。
每个数组的维度的元素数量是不一样的,所以计算起来就是非均匀进制的数学数值表示。