概述
占用率的定义
/*SM(Streaming Multiprocessor,流式多处理器):构成GPU的基本硬件单元;
multiprocessor:在CUDA里概念和SM一样;
激活warp:在warp中的所有线程在核函数中从开始执行到全部结束的过程;
在每个SM中存在允许最大激活warp的数量;
*/
占用率(occupancy):在SM上实际激活warp数量与理论最大激活warp数量之比。占用率从warp的使用到结束都在变,不同的SM,占用率也有可能不一样。
低占用率无法隐藏延时,高占用率使得每个线程计算任务少。因此,对CUDA程序性能分析,首先要判断不同占用率对核函数性能的影响。