
Shared Memory,Warp和Bank Conflict
1. 概念Shared memory是片上存储器,因此与local memory或global memory相比更高的带宽和更低的延迟。前提是线程之间没有 bank conflicts。为了实现高带宽,共享内存被划分为大小相等的内存模块,称为Banks,可以同时访问。因此,任何由 n 个地址组成的内存读取或写入请求都可以同时提供服务,从而产生比单个模块带宽高 n 倍的总带宽。但是,如果内存请求的两个地址位于同一Bank中,则存在bank conflict,并且必须序列化访问。硬件........




