视觉与图形学领域的封神论文-MobileNets有效的卷积网络用于移动视觉

67bbc220f5326c57e26232ddc1788d89.jpeg

MobileNet模型可应用于各种识别任务,以实现高效的设备智能。

摘要:我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构,使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数,可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实验,与其他流行的ImageNet分类模型相比,我们表现出了强大的性能。然后,我们展示了MobileNet在广泛的应用和用例中的有效性,包括目标检测、细粒度分类、人脸属性和大规模地理定位

310b3a0bfdecc3b1d183bfd9eb3ed348.jpeg

将(a)中的标准卷积滤波器替换为两层:深度卷积(b)和点卷积(c),以构建深度可分离滤波器。

(a)输入的feature map有M个,输出的feature map有N个。Standard convolution呢,是采用N个大小为DKDK的卷积核进行操作(注意卷积核大小是DKDK)

Depthwise convolution :一个卷积核负责一个通道,一个通道只被一个卷积核卷积;则这里有M个DKDK的卷积核;

Pointwise convolution:为了达到输出N个feature map的操作,所以采用N个1*1的卷积核进行卷积,这里的卷积方式和传统的卷积方式是一样的,只不过采用了1*1的卷积核;其目的就是让新的每一个feature map包含有上一层各个feature map的信息!在此理解为将depthwise convolution的输出进行“串”起来。

a10e5b4170b867af6114ea7e13b01e6f.jpeg

左:带batchnorm和ReLU的标准卷积层。右图:带深度层和点层的深度可分离卷积,后跟batchnorm和ReLU

3cda9d05fd8b1ef140e6645249d3aecf.jpeg

764029f4b2c715af00aedb2f12d60c1a.jpeg

实验结果:后面则是一些具体的实验,表明mobileNet在参数量和精度上的权衡。

fa73a94ecd8088edeed9d000c8d0cf63.jpeg

微信公众号:

下载对应的论文,在公众号中回复:paper

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值