参考:https://blog.csdn.net/avideointerfaces/article/details/88243699
最近看目标检测论文,经常看到BFLOPS的概念,对其比较疑惑,这里结合源代码来理解一下.
BFLOPS有两个不同场景下的解释,第一种是描述硬件运算性能的单位,这时其全称是Billion Float operations per second,即每秒能进行多少个 十亿次浮点运算符;第二种是描述某次卷积运算需要的多少个十亿次浮点运算,其全称是billion float operations,将多次卷积等运算所耗费的blops加起来就可以来表示某个算法模型的复杂度.
显然,darknet中的bflops表示的是第二种含义,代码中其计算公式为:
下面从左到右解释每个常量或变量的含义.
2.0表示一次乘法和一次加法浮点运算
l.n表示卷积核数目
l.size表示卷积核大小(size*size)
l.c表示待卷积图像的个数
l.out_h和l.out_w表示卷积后图像的大小,业等与完成某个卷积核扫描完该图像所需要卷积次数.它取决于输入图像大小,卷积核大小,stride以及pad等因素,其计算公式为
(l.h + 2*l.pad - l.size) / l.stride + 1; (l.w + 2*l.pad - l.size) / l.stride + 1
现在举一个例子简单说明下
待卷积输入图像尺寸为608*608*3,现在使用32个size为3的卷积核32*3*3对输入图像进行卷积,其步长为1,padding为1,那么该卷积层锁耗费的总的运算次数为:
(2.0 * l.n * l.size*l.size*l.c * l.out_h*l.out_w) = (2.0*32*3*3*3*[(608+2*1-3)/1+1]*[(608+2*1-3)/1+1]) = 638779392
最后除以billion(10^9) 来转换成BFLOPS单位: 638779392/10^9 约= 0.6388 BFLOPS