深度可分离卷积_深度可分离卷积性能研究

本文对比了深度可分离卷积与普通卷积的性能,发现深度可分离卷积在参数量和计算量上显著减少,但在GPU上的速度并不一定更快,特别是在TPU和某些CPU平台上。在训练测试中,普通卷积在精度和数据吞吐量上表现出优势,而CPU平台在使用深度可分离卷积时表现最佳。
摘要由CSDN通过智能技术生成

对比普通卷积和深度可分离卷积FLOPs,在不同硬件平台下对比计算强度,实测训练和工程部署的精度和计算量。


深度可分离卷积(简写 DepSep Conv)已经被证明了可以作为传统卷积的有效代替方案,并且已经成熟地应用在了很多模型中,例如非常有实际工程意义的两个网络MobileNet[1]和EfficientNet[2]

使用深度可分离卷积的网络相比传统卷积网络,具有较少的参数,并且在浮点运算(FLOPs)上也具有非常大的优势。但是由于现在一些计算加速器(GPU,NPU等)的复杂程度很大,导致FLOPs和参数数量等指标和实际性能不符。

在这篇文章中,我们将对比深度可分离卷积和普通卷积之间的区别,然后通过测试研究解释GPU的理论性能和现实性能之间的差异。

深度可分离卷积和普通卷积对比

普通卷积过程

c6e01b66d4e3d22c90ede5ae06b8df8a.png

深度可分离卷积过程

深度可分离卷积可以看做是两个过程,第一个过程是将深度信息分离,第二个过程是使用1*1卷积来进行通道融合,还原到目标尺寸

909c6109468e2286395e8cc62dc108b9.png

两者参数量和计算量比较

779ac2751506cdbc53420af49be21a67.png

计算量也就是FLOPs,普通卷积的参数量(Parameters)为 Dk·Dk·M·N 深度可分离卷积的参数量为Dk·Dk·M+M·N,假设卷积核尺寸为Dk=3,输入特征图维度M=128,输出特征图维度N=128,输入特征图尺寸为224,可以分别计算一下两者的参数量和计算量

</
普通卷积 深度可分离卷积
  • 9
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值