MobileNets:Efficient Convolution Neural Networks for mobile Vision Application
网上资源
网上已经有很多超级好的资源了,为了不每次都百度瞎找,把这些都放在这里了
论文地址
一个棒棒的博客
主要思想
为了能够使得神经网络模型可以在嵌入式设备,比如手机中运行,必须减少模型的大小和加快模型的运行速度。文章为了减小模型中的参数(即减少模型的大小)以及加快速度,将卷积层的卷积操作,分解成了两步操作,一步做filter,一步做conbination。对应的一个叫depthwise convolution,一个叫pointwise convolution。
卷积操作的分解
普通卷积层的操作
对于神经网络中的一个卷积层的操作,如下图(这大概是全世界最棒的动图了)。
如图所示:卷积层的输入7*7*3,对应输入层的矩阵大小 DF * DF 为7*7,通道数M为3。卷积核的大小 DK * DK * M * N为3*3*3*2,步长为2*2。卷积过程如下图,得到的输出3*3*2,矩阵大小 DG * DG