图像识别算法_图像识别—MobileNets算法详解

本文详细介绍了MobileNets算法,一种用于移动视觉应用的高效卷积神经网络。通过将标准卷积分解为depthwise convolution和1*1的pointwise convolution,MobileNets在保持较高准确率的同时,显著减少了计算时间和参数数量。文章还探讨了模型的优化技巧,如Width Multiplier和Resolution Multiplier,并指出模型加速和压缩是未来深度学习的重要方向。
摘要由CSDN通过智能技术生成
e3cff74f4a850605885f1b5c65bf2119.gif点击蓝字关注我们

AI研习图书馆,发现不一样的世界

图像识别MobileNets算法解析

本篇文章来介绍一个深度学习模型轻量化和加速的算法:MobileNets,可以在基本不影响准确率的前提下大大减少计算时间和参数数量。

论文题目:MobileNets Efficient Convolutional Neural Networks for Mobile Vision Applications

论文链接:MobileNets

Caffe框架代码:MobileNet-Caffe

1164322c050327bd7a4ecc4c72e7c570.png

算法简介

深度学习网络广泛应用在图像分类,目标检测任务中,但是网络结构复杂,参数过多,计算时间过长使其不容易在移动端应用。因此像模型压缩、模型加速应该会是未来深度学习比较活跃的一个领域。

本文提出一种将传统的卷积结构改造成两层卷积结构的网络:MobileNets,采用类似ResNext里面的group操作来实现。这种新的结构可以在基本不影响准确率的前提下大大减少计算时间(约为原来的1/9)和参数数量(约为原来的1/7)。

本篇文章中若不特殊强调的话,卷积核默认都是三维,这三维分别对应长、宽和输入通道数,因为不同人对卷积核维度的理解不同。对于常规卷积而言,假设输入特征通道数是M,卷积核的长宽分别是DK和DK,卷积核的数量是N,那么可以说是有N个M*DK*DK卷积核,也可以说是有N组卷积核,每组有M个DK*DK的卷积核。不管是哪种理解,都不影响卷积层的本质:该层有N*M*DK*DK个参数。

算法笔记

MobileNet模型的核心就是将原本标准的卷积操作因式分解成一个depthwise convolution和一个1*1的卷积(文中叫pointwise convolution)操作。简单讲就是将原来一个卷积层分成两个卷积层,其

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值