Nsight compute ---- Memory Chart
Memory Chart
- 逻辑单元(绿色)包括:Kernel、全局内存、局部内存、纹理内存、表面内存、共享内存;
- 物理单元(蓝色)包括:L1/TEX缓存、共享内存、L2缓存、系统内存、设备内存;其中L1/TEX缓存和共享内存共享片上内存。
- 逻辑单元之间的连线表示kernel访问目标逻辑单元的质量数量。例如Kernel到Global之间的连线表示从全局内存空间中读写的指令数。
- 逻辑单元和物理单元之间的连线表示指令对应的请求数量。例如从L1/TEX缓存到Global的连线表示全局加载指令对应的请求数量。 连线的颜色对应相比于峰值的传输利用效率。
Memory Table
Shared Memory
Properties | Description |
---|---|
Instructions | 每个warp执行的相关指令总数量 |
Wavefronts | |
%Peak | 相对于峰值的百分比 |
Bank Confilicts | 出现bank冲突的数量 |
L1/TEX Cache
Properties | Description |
---|---|
Sectors | 32字节的内存块,L1和L2缓存线是4个扇区,即128字节 |
Wavefronts | |
Sectors/Req | 平均一次L1请求所需的扇区数量,最坏的情况为32 |
Hit Rate | 没有命中的扇区需要从L2中加载,这个数据高表示可以从L1直接加载,延迟更低 |
Bytes | 从L1中加载的所需的数据,理想情况是扇区数的32倍,即所有加载的数据都是需要的 |