同一个block内的不同thread可以通过shared memeory进行通信, 不同的block 之间的数据通信要通过 global memory 每个kernel函数拥有一个grid,不同kernel函数属于不同 block函数