EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks (2019)论文笔记

最新推荐文章于 2024-07-17 11:25:35 发布

qq_41732520

最新推荐文章于 2024-07-17 11:25:35 发布

阅读量621

点赞数

分类专栏：读论文

本文链接：https://blog.csdn.net/qq_41732520/article/details/91470327

版权

EfficientNet论文探讨了在有限计算资源下，如何通过结合增加深度、宽度和图像分辨率（compound scaling method）来优化模型性能。这种方法在保持高效的同时，提升了模型准确率，例如在ImageNet上实现了84.4% top-1和97.1% top-5的准确率，同时减少了8.4x的参数量和6.1x的计算速度。相比传统仅改变单一维度的规模调整，复合缩放能更有效地提升模型效果。

摘要由CSDN通过智能技术生成

论文链接: EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks.
代码链接: tensorflow.

简介

加深扩大神经网络(model scaling up)可以有效提升模型的准确率，但是计算资源是有限的。本文讨论了在有限的运算资源下，通过增加深度（网络层数）、增加宽度（每层通道数）、增加图像分辨率三种网络扩张方式的叠加来达到最优准确率。该方法称为compound scaling method。该拓宽网络的方法附加于现有的state of art级网络可以有效提高准确率。基于GPipe的EfficientNet-B7在ImageNet达到了84.4% top-1 / 97.1% top-5的准确率，并且比现有的卷积网络小8.4x，快6.1x。EfficientNet家族在其他数据集上也达到了state of art的结果，CIFAR-100 (91.7%), Flowers (98.8%)等。

传统Scaling up的方法

传统的model scaling只改变网络的某一个部分的大小。如Figure 2中的b、c、d分别拓宽了网络的宽度、深度、分辨率。这三种方法在一定范围内都可以有效提高模型准确率。但是scale up到一定程度后，模型的准确率很难再继续增长了，如Figure 3。
Scaling up a model with one coefficient
三种方法分别存在的问题