深度可分离卷积_深度可分离卷积性能研究

最新推荐文章于 2024-05-16 02:19:10 发布

weixin_39541681

最新推荐文章于 2024-05-16 02:19:10 发布

阅读量3.1k

点赞数 9

文章标签：深度可分离卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39541681/article/details/111382230

版权

本文对比了深度可分离卷积与普通卷积的性能，发现深度可分离卷积在参数量和计算量上显著减少，但在GPU上的速度并不一定更快，特别是在TPU和某些CPU平台上。在训练测试中，普通卷积在精度和数据吞吐量上表现出优势，而CPU平台在使用深度可分离卷积时表现最佳。

摘要由CSDN通过智能技术生成

对比普通卷积和深度可分离卷积FLOPs，在不同硬件平台下对比计算强度，实测训练和工程部署的精度和计算量。

深度可分离卷积(简写 DepSep Conv)已经被证明了可以作为传统卷积的有效代替方案，并且已经成熟地应用在了很多模型中，例如非常有实际工程意义的两个网络MobileNet^[1]和EfficientNet^[2]。

使用深度可分离卷积的网络相比传统卷积网络，具有较少的参数，并且在浮点运算(FLOPs)上也具有非常大的优势。但是由于现在一些计算加速器(GPU,NPU等)的复杂程度很大，导致FLOPs和参数数量等指标和实际性能不符。

在这篇文章中，我们将对比深度可分离卷积和普通卷积之间的区别，然后通过测试研究解释GPU的理论性能和现实性能之间的差异。

深度可分离卷积和普通卷积对比

•普通卷积过程

•深度可分离卷积过程

深度可分离卷积可以看做是两个过程，第一个过程是将深度信息分离，第二个过程是使用1*1卷积来进行通道融合，还原到目标尺寸

•两者参数量和计算量比较

计算量也就是FLOPs，普通卷积的参数量(Parameters)为 Dk·Dk·M·N 深度可分离卷积的参数量为Dk·Dk·M+M·N,假设卷积核尺寸为Dk=3，输入特征图维度M=128，输出特征图维度N=128，输入特征图尺寸为224，可以分别计算一下两者的参数量和计算量

</

	普通卷积	深度可分离卷积

最低0.47元/天解锁文章

weixin_39541681

关注

9
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
深度可分离卷积_深度可分离卷积性能研究

对比普通卷积和深度可分离卷积FLOPs，在不同硬件平台下对比计算强度，实测训练和工程部署的精度和计算量。深度可分离卷积(简写 DepSep Conv)已经被证明了可以作为传统卷积的有效代替方案，并且已经成熟地应用在了很多模型中，例如非常有实际工程意义的两个网络MobileNet[1]和EfficientNet[2]。使用深度可分离卷积的网络相比传统卷积网络，具有较少的参数，并且在浮点运算...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。