导读
Roofline model 一个衡量计算机软件/硬件性能的一个分析模型
Roofline Model与深度学习模型的性能分析
论文地址
摘要
其实就一句话:提出一种易于理解的视觉性能模型,为程序员和架构师提供关于改进浮点计算的并行软硬件的见解。
Introduction
这一部分简单叙述现如今计算机体系结构下,多核心处理器的核心数逐年翻倍,意味着微处理器会变的更加多样化,因此对架构师等来说,加剧其工作难度,为此作者提出一种模型,帮助开发者。
THE ROOFLINE MODEL
作者认为芯片外储存器带宽往往是限制性资源,因此需要一个模型,将处理器性能与芯片外内存流量关联起来。
首先定义operational intensity (计算密度)单位是FLOPs/Byte,表示的是传送单位数据可以进行的浮点运算数。
先来看operational intensity (计算密度)公式: 计算密度 = 计算量 / 访存量 . 计算密度= 计算量/访存量.