- 博客(1)
- 收藏
- 关注
原创 roofline模型
roofline模型用于描述在计算平台的算力和带宽的限制下,程序所能达到的理论性能上界。 如上图,为roofline模型的示意图,有三个重要概念: 算力:每秒所完成的浮点运算次数,单位为FLOP/s或GFLOP/s 带宽:每秒所完成的内存读取量,单位为Byte/s或GByte/s 计算密度:又称访存比,是算力与带宽的比值,即每字节读取所完成的浮点运算量,单位为FLOP/Byte 可以看到,roofline模型的纵轴为可达算力,Attainable GFLOPs=min(Peak GFLOPs, AI*
2021-11-25 14:15:08 4939 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人