摘要
论文介绍
-
EfficientNetV2概述:EfficientNetV2是谷歌在2019年发布的卷积模型,旨在实现更快的训练速度和更高的参数效率。这些模型通过结合训练感知神经架构搜索和缩放技术来共同优化训练速度和参数效率。
-
研究背景:随着模型大小和训练数据量的增加,训练效率成为深度学习领域的重要关注点。EfficientNetV2的提出旨在解决当前模型训练中存在的训练时间长、参数规模大等问题。
创新点
-
训练感知神经架构搜索:EfficientNetV2采用了训练感知的神经架构搜索方法,能够在丰富的搜索空间中自动找到最优的模型架构,从而在保证性能的同时提高训练效率。
-
改进的渐进学习方法:为了进一步提高训练速度,本文提出了一种改进的渐进学习方法。该方法在训练过程中逐步增加图像尺寸,并自适应地调整正则化强度,以平衡不同图像尺寸下的网络容量和过拟合风险。
方法
-
MBConv模块:EfficientNetV2中引入了Fused-MBConv模块&#