MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications论文解读
一、论文地址及贡献
2.1论文地址
https://arxiv.org/abs/1704.04861
2.2论文贡献
论文为移动和嵌入式视觉应用提出了一类称为MobileNets的高效模型。MobileNets基于流线型架构,使用深度可分离卷积来构建轻量级深度神经网络。
二、MobileNets模型结构
2.1深度可分离卷积
MobileNet模型基于深度可分离卷积,这是一种分解卷积的形式,它将标准卷积分解为深度卷积和1×1卷积,称为逐点卷积。对于MobileNets,深度卷积对每个输入通道应用一个filter。逐点卷积然后应用1×1卷积来组合深度卷积的输出。标准卷积在一个步骤中将输入过滤并组合成一组新的输出。深度方向的可分离卷积将其分为两层,一层用于过滤,另一层用于合并。这种因子分解具有显著减少计算和模型大小的效果。下图显示了如何将标准卷积2(a)分解为深度卷积2(b)和1 × 1逐点卷积2©。
标准卷积层将DF× DF× M特征映射F作为输入,并产生DF× DF× N特征映射G,其中DF是正方形输入特征映射1的空间宽度和高度,M是输入通道的数量(输入深度),DG是正方形输出特征映射的空间宽度和高度,N是输出通道的数量(输出深度)。
标准卷积层由大小为DK×DK×M×N的卷积核K参数化,其中DK是假设为平方的核的空间维度,M是输入通道的数量,而N是先前定义的输出