MobileNet
创新点
使用深度可分离卷积,把标准卷积核N*N*C分成了N*N*1 + 1*1*C。
图片大小为s*s*c,标准卷积核为k*k*c*filter_num
分离卷积核后为k*k*1 对 图片的c个通道分别进行卷积,得到m*m*c,m为卷积后的图片长宽。
m*m*c通过1*1*c*filter_num,得到m*m*filter_num的feature map。
模型缩小为原来的
m∗m∗k∗k∗c+m∗m∗c∗filternumm∗m∗k∗k∗c∗filternum=1filternum+1k∗k m ∗ m ∗ k ∗ k ∗ c + m ∗ m ∗ c ∗ f i l t e r n u m m ∗ m ∗ k ∗ k ∗ c ∗ f i l t e r n u m = 1 f i l t e r n u m + 1 k ∗ k两个剪枝因素
Width Multiplier: Thinner Models
减小模型的filter个数Resolution Multiplier: Reduced Representation
减小层的输入输出
通过以上两个trick,减小模型规模。
拓展阅读
https://github.com/Ewenwan/MVision/tree/master/CNN/MobileNet
CNN网络优化学习总结——从MobileNet到ShuffleNet:https://blog.csdn.net/sun_28/article/details/78170878#mjx-eqn-1