EfficientNet 《EfficientNet:Rethinking model scaling for convolutional neural networks》

最新推荐文章于 2024-09-09 09:11:17 发布

sunny_develop

最新推荐文章于 2024-09-09 09:11:17 发布

阅读量799

点赞数

分类专栏：深度学习文献文章标签：深度学习

本文链接：https://blog.csdn.net/guanyuqiu/article/details/108467261

版权

深度学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

文献

9 篇文章 0 订阅

订阅专栏

作者想要达到算法准确度和效率的双重提升，一般提高准确度的方法主要是增加模型的深度或宽度，或者增加图像输入的分辨率。

在准确率方面，自从2012年AlexNet赢得了ImageNet的冠军，卷积神经网络变得越来越流行并且越来越大，2014年冠军GoogleNet有6.8M的参数，2017年的SENet有145M的参数，最新的GPipe有557M的参数量，GPipe这么大的网络很难在普通的服务器上进行训练，所以也很难普及应用。

在计算效率方面，普遍采用模型压缩的方式，能够在移动设备端进行应用的如SequeezeNets、MobileNets、ShuffleNets.最近对于移动端应用的模型比较流行的方式是采用结构检索的方式。

深度学习模型结构的变化主要是深度、宽度和输入图像尺寸的变化，ResNet通过增加模型的深度从ResNet-18变为ResNet-200, WideResNet和MobileNet通过调整模型的宽度实现，在研究中发现输入图像大分辨率会提高准确率。

问题抽象

利用公式的形式来描述网络模型，将整个网络称为，网络的第个卷积层的可以定义为函数： $Y{_{i}}=F{_{i}}(X{_{i}})$