对比普通卷积和深度可分离卷积FLOPs,在不同硬件平台下对比计算强度,实测训练和工程部署的精度和计算量。
深度可分离卷积(简写 DepSep Conv)已经被证明了可以作为传统卷积的有效代替方案,并且已经成熟地应用在了很多模型中,例如非常有实际工程意义的两个网络MobileNet[1]和EfficientNet[2]。
使用深度可分离卷积的网络相比传统卷积网络,具有较少的参数,并且在浮点运算(FLOPs)上也具有非常大的优势。但是由于现在一些计算加速器(GPU,NPU等)的复杂程度很大,导致FLOPs和参数数量等指标和实际性能不符。
在这篇文章中,我们将对比深度可分离卷积和普通卷积之间的区别,然后通过测试研究解释GPU的理论性能和现实性能之间的差异。
深度可分离卷积和普通卷积对比
•普通卷积过程
•深度可分离卷积过程
深度可分离卷积可以看做是两个过程,第一个过程是将深度信息分离,第二个过程是使用1*1卷积来进行通道融合,还原到目标尺寸
•两者参数量和计算量比较
计算量也就是FLOPs,普通卷积的参数量(Parameters)为 Dk·Dk·M·N 深度可分离卷积的参数量为Dk·Dk·M+M·N,假设卷积核尺寸为Dk=3,输入特征图维度M=128,输出特征图维度N=128,输入特征图尺寸为224,可以分别计算一下两者的参数量和计算量
普通卷积 | 深度可分离卷积 | </