私有的,对于每个SM,no-blocking 非阻塞caching local & global memory access每个 SM 周期 可以处理 2个 access传入的内存请求,不能跨越 2 及以上的 cache lineL1D