1、论文
论文题目:《GhostNets on Heterogeneous Devices via Cheap Operations》
论文地址: https://arxiv.org/pdf/2201.03297.pdf
代码地址: https://github.com/huawei-noah/CV-Backbones
2、引言
本文针对网络部署时面临的内存和资源有限的问题,提出两种不同的Ghost模块,旨在利用成本低廉的线性运算来生成Ghost特征图。
C-Ghost模块被应用于CPU等设备,并通过简单的模块堆叠实现C-GhostNet。
进一步考虑GPU设备的高效网络。不需要在构建阶段涉及太多gpu效率低的操作(例如,深度卷积),建议利用阶段性特征冗余来制定gpu效率高的G-Ghost stage结构。将某一stage的特征分为两部分,其中第一部分使用输出通道较少的原始块来生成内在特征,而另一部分使用利用阶段冗余的廉价操作来生成。
在基准上进行的实验证明了提出的C-Ghost模块和G-Ghost stage的有效性。C-GhostNet和G-GhostNet可以实现精度和延迟的最佳权衡。
3、发现问题
3.1
虽然C-GhostNets在保持高性能的同时保持准确度不变,但用于生成更多特性的廉价操作在GPU上仍不是非常廉价和高效。具体来说,深度卷积的运算强度通常较低,即计算与内存运算的比率,不能充分利用并行计算能力。如何在精度和GPU延迟之间取得更好的平衡,仍然是一个被忽视的问题。
除了FLOPs和参数数量,Radosavovic等人引入了激活度activations来测量网络的复杂性,即所有卷积层的输出张量的大小。GPU上的

论文提出了C-Ghost和G-Ghost模块,旨在解决网络部署在资源有限设备上的问题。C-GhostNet适合CPU,而G-GhostStage针对GPU优化,通过阶段特征冗余减少深度卷积,以实现精度和延迟的平衡。文章还讨论了激活度作为衡量GPU延迟的关键因素,并介绍了混合操作来增强Ghost特征的语义信息。G-GhostNet是基于这些概念构建的网络结构。
最低0.47元/天 解锁文章
3662

被折叠的 条评论
为什么被折叠?



