EfficientNet

最新推荐文章于 2024-08-15 20:38:21 发布

木瓜强

最新推荐文章于 2024-08-15 20:38:21 发布

阅读量653

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/disguise666/article/details/106295142

版权

深度学习专栏收录该内容

5 篇文章 4 订阅

订阅专栏

一、背景介绍

卷积神经网络通常是在固定资源预算下开发的，如果可用资源有变化，则可以进行Model Scaling（模型缩放）以提高模型性能。为了获得更高的准确率和效率，对卷积网络进行缩放是近几年研究者们经常干的事情，比如从ResNet-18到ResNet-200是对depth的缩放，MobileNet系列里width multiplier对channel的缩放等等。然而，大家都在模型缩放了，而且放缩depth、width(channel)以及resolution都是有效的，但是并没有人总结出原理性的方法来指导模型缩放。大家都是任意地对其中一两个维度进行缩放，缩放多少也得靠手动调整，不仅过程繁琐，而且这样的“野路子”产生的网络性能也不是最佳的。如下图所示，分别增大网络三个维度到一定程度，准确率会饱和：

在这里插入图片描述于是，EfficientNet的作者决定总结出教科书般的模型缩放原则。他们提出了一种简单高效的模型缩放方法，即compound scaling method（复合缩放方法）。下图展示了对不同维度缩放的区别：

二、思路提出

2.1 Compound scaling method

按道理来说，输入图片分辨率越高，也就需要更深的网络来扩大感受野，更多的通道来捕捉特征。考虑到深度、宽度和分辨率之间应该是有联系的，作者设置了不同深度和分辨率的网络作为对照，同时对网络的宽度进行缩放，发现d = 2, r = 1.3组不容易饱和，而且在同等FLOPs下，准确率最高。这就验证了作者的猜想：平衡好网络三个维度的缩放系数可以得到更好的效率和准确率。

在这里插入图片描述

鉴此，作者提出了以下的基本优化模型，在资源（Memory、FLOPS）有限的情况下，通过三个维度的缩放，最大化准确率：
在这里插入图片描述

其中 $N (d, w, r)$ 表示缩放系数分别为 $d, w, r$ 的卷积网络， $\hat{F}_i^{\hat L_i}$ 表示第 $i$ 个阶段(stage) $F_i$ 层重复了几次（卷积网络可以被划分为几个阶段，如ResNet有五个阶段），并且depth、width、resolution都乘上缩放系数。

随之而来的问题是，这些系数怎么确定呢？首先作者不会变动baseline的具体参数设置，其次所有层的缩放系数都是相同的，这样可以减小参数空间。但仅仅这两个限制条件还是不够的，作者提出了复合缩放方法：
在这里插入图片描述
其中， $\alpha, \beta, \gamma$ 为基本缩放系数，也可以看作是资源分配在三个维度上的比例；而 $\phi$ 是复合缩放系数，其控制着当前消耗的资源量。另外，通常FLOPS的大小是和 $\alpha, \beta^2, \gamma^2$ 成比例的，如果宽度和分辨率增加一倍，那么计算量就会增至四倍，如果深度增加了一倍，那么计算量增至两倍，所以限制 $\alpha \cdot \beta^2 \cdot \gamma^2$ 也是为了方便控制资源占用。再考虑 $\phi$ 的影响，缩放后的网络总资源消耗量是初始资源的 $(\alpha \cdot \beta^2 \cdot \gamma^2)^\phi$ 倍。

2.2 EfficientNet

在求解上面两组模型之前，先讲讲什么是EfficientNet。因为模型缩放不会改变每一层的参数设置，所以有个好的baseline 对模型缩放的效果很重要。作者借鉴了MnasNet，以 $\times \left[FLOPS(m) / T\right]^w$ 为优化目标，采用了和MnasNet一样的搜索空间，设计出了和MnasNet类似的网络，即为EfficientNet，可以看一下EfficientNet-B0的网络结构，主要是以MobileNet_v2中提出的inverted bottleneck为主：

在这里插入图片描述
现在讲一下怎么求解之前的模型：

固定 $\phi = 1$ ，即假设了两倍初始资源，利用小网格搜索（告辞）确定 $\alpha, \beta, \gamma$ ，即为EfficientNet-B0。
然后在得到的 $\alpha, \beta, \gamma$ 基础上，增大 $\phi$ ，继而得到EfficientNet-B1至EfficientNet-B7。