MobileNet v2算法解读

最新推荐文章于 2023-10-13 20:44:28 发布

‘Atlas’

最新推荐文章于 2023-10-13 20:44:28 发布

阅读量1.7k

点赞数

分类专栏：深度学习论文详解文章标签： MobileNet v2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41994006/article/details/94322418

版权

论文详解同时被 2 个专栏收录

72 篇文章 15 订阅

订阅专栏

45 篇文章 3 订阅

订阅专栏

论文地址：MobileNetV2: Inverted Residuals and Linear Bottlenecks

1.改进

MobileNet V2是Google继V1之后提出的下一代轻量化网络，主要解决了V1在训练过程中非常容易特征退化的问题，V2相比V1效果有一定提升。

2.核心

v2沿用v1的Depthwise Separable Convolutions Depthwise。核心主要由两部分：Inverted residuals与Linear Bottlenecks

2.1Inverted residuals

残差结构与反向残差结构Fig.3所示，简单来说通常的残差网络为先通过1*1卷积将通道数压缩，再经过3*3卷积，最后经过1*1卷积进行扩张；而反向残差网络channel为先扩张后压缩。

引入shortcut是为提高梯度在多层之间的传播能力，防止梯度消失。

采用反向残差是为了提高内存利用率。

2.2Linear Bottlenecks

经过反向残差模块，输出的feature map经过channel压缩，损失一部分特征，如果使用relu激活函数，会损失更多特征，因此采用线性变换，即Linear Bottlenecks。

3.网络结构

bottleneck单元结构如表1所示：

输入的feature map首先经过1*1的卷积进行升维，激活函数为Relu6，channel扩大为t倍，而后进行kernal为3*3的深度可分离卷积操作，激活函数为relu6，最后经过kernal为1*1的卷积进行降维，不接非线性激活函数，relu。

Relu6 = min(max(features, 0), 6)，限制最大输出为6，这是为了在移动端设备float16的低精度的时候，也能有很好的数值分辨率。

Fig4对比各种网络的卷积block。注意图d中MobileNet v2的两种block形式，stride=1时，输出feature map大小不变，因此可以进行add操作，当stride=2时，输出feature map减半，因此不能进行add操作。

表2为整个MobileNet v2的网络结构

4.实验

在ImageNet数据集上，mobilenet v2与其他网络结构性能比较如表4所示：

表5是关于SSD和SSDLite在关于参数量和计算量上的对比。SSDLite是将SSD网络中的3*3卷积用depthwise separable convolution代替得到的。

表6是几个常见目标检测模型对比：

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
MobileNet v2算法解读

论文地址：MobileNetV2: Inverted Residuals and Linear Bottlenecks1.改进MobileNet V2是Google继V1之后提出的下一代轻量化网络，主要解决了V1在训练过程中非常容易特征退化的问题，V2相比V1效果有一定提升。2.核心v2沿用v1的Depthwise Separable Convolutions Depthwise。...
复制链接

扫一扫

专栏目录

‘Atlas’ CSDN认证博客专家 CSDN认证企业博客

码龄6年

103: 原创

1911: 周排名

8664: 总排名

46万+: 访问

: 等级

3171: 积分

1万+: 粉丝

365: 获赞

174: 评论

1840: 收藏

私信

关注

分类专栏

论文详解 72篇
工程实践 6篇
数据集 1篇
NLP 1篇
3D重建 5篇
通用分割 6篇
实例分割 10篇
数据生成 23篇
跨模态 25篇
虚拟试衣 6篇
图像修复 1篇
工具 1篇
视频生成 7篇
文本识别 1篇
Transformer 8篇
风格迁移 1篇
自监督 1篇
姿态估计 3篇
联邦学习 2篇
姿态迁移 2篇
image translation 1篇
GNN 1篇
深度学习 45篇
机器学习 3篇
Python 6篇
anaconda 1篇
数据结构 1篇
安装 1篇
目标检测 10篇

最新评论

BLIP2-图像文本预训练论文解读
失落的艺术: 这个query embeding和输入图像经过ImageEncoder得到的向量是一个东西吗？还是另外又增加了一个随机向量Query embeding？
BLIP2-图像文本预训练论文解读
巷猫和斑马: 可学习的query embedding就是Q-Former中图像编码器的输入，因为在BLIP2中Image Encoder被冻结了，所以无法通过调整Image Encoder的参数使得学习到的图像特征向量与文本特征向量align，所以使用可学习的Query作为代替，它可以同时考虑图像和文本的特征，以此作为align的桥梁
BLIP2-图像文本预训练论文解读
小喜久: 想问一下，在Q-Former左侧的图像transformer中的可学习query embedding是什么呀
虚拟试衣-DiOr论文解读
m0_59079608: 您好，请问您部署好了吗，可以请教下怎么部署的吗？
BLIP使用教程
DRACO于: 你好，cannot import name BlipProcessor这种是什么原因，单独import transformer是没问题的，也尝试过更新upgrade，已是最新版本

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。