视觉与图形学领域的封神论文-MobileNets有效的卷积网络用于移动视觉

元宇宙MetaAI

于 2021-09-23 07:00:00 发布

阅读量79

点赞数

文章标签：卷积神经网络深度学习计算机视觉 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CSS360/article/details/126388535

版权

MobileNet模型可应用于各种识别任务，以实现高效的设备智能。

摘要：我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构，使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数，可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实验，与其他流行的ImageNet分类模型相比，我们表现出了强大的性能。然后，我们展示了MobileNet在广泛的应用和用例中的有效性，包括目标检测、细粒度分类、人脸属性和大规模地理定位。

将（a）中的标准卷积滤波器替换为两层：深度卷积（b）和点卷积（c），以构建深度可分离滤波器。

（a）输入的feature map有M个，输出的feature map有N个。Standard convolution呢，是采用N个大小为DKDK的卷积核进行操作（注意卷积核大小是DKDK）

Depthwise convolution ：一个卷积核负责一个通道，一个通道只被一个卷积核卷积；则这里有M个DKDK的卷积核；

Pointwise convolution：为了达到输出N个feature map的操作，所以采用N个1*1的卷积核进行卷积，这里的卷积方式和传统的卷积方式是一样的，只不过采用了1*1的卷积核；其目的就是让新的每一个feature map包含有上一层各个feature map的信息！在此理解为将depthwise convolution的输出进行“串”起来。

左：带batchnorm和ReLU的标准卷积层。右图：带深度层和点层的深度可分离卷积，后跟batchnorm和ReLU

实验结果：后面则是一些具体的实验，表明mobileNet在参数量和精度上的权衡。

微信公众号：

下载对应的论文，在公众号中回复:paper

元宇宙MetaAI

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
视觉与图形学领域的封神论文-MobileNets有效的卷积网络用于移动视觉

MobileNet模型可应用于各种识别任务，以实现高效的设备智能。摘要：我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构，使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数，可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。