MobileNet V1 V2系列学习笔记

最新推荐文章于 2023-10-25 09:51:10 发布

ToLiveXX

最新推荐文章于 2023-10-25 09:51:10 发布

阅读量218

点赞数 1

分类专栏： Deep Learning 文章标签：卷积深度学习计算机视觉神经网络卷积神经网络

本文链接：https://blog.csdn.net/qq_36766560/article/details/111910229

版权

Deep Learning 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

MobileNet 系列详解

MobileNet V1

1.主要贡献

提出了深度可分离卷积结构，大大减小了计算量和模型的大小。

2.深度可分离卷积

标准卷积的作用是过滤特征并合并，而深度可分离卷积将标准卷积的过滤与组合分开做，分解为：深度卷积(Depthwise) 和 逐点卷积(Pointwise)。

深度卷积对每个输入通道应用单个过滤器
逐点卷积(1×1卷积)创建线性组合

上图右边是深度可分离卷积对Depthwise和Pointwise两层都使用Batchnorm和Relu非线性激活

3.深度可分离卷积与标准卷积的计算量对比

假设：
输入feature map F： $D_F*D_F*M$
输出feature map G： $D_F*D_F*N$
卷积核K： $D_K*D_K*M*N$
那么：
标准卷积计算的开销： $D_K*D_K*m*N*D_F*D_F$
深度可分离卷积的开销： $D_k*D_k*M*D_F*D_F+M*N*D_F*D_F$

4. 两个超参数

宽度倍增系数 $α$ ：Thinner Models，对每一层均匀地细化网络
- 输入通道数 $M α$ ，输出通道数 $N α$
- 开销： $D_k*D_k*αM*D_F*D_F+αM*αN*D_F*D_F$
- $\in (0,1]$ ,一般用 $(0.75, 0.5, 0.25)$ ,降低模型的宽度
分辨率系数 $ρ$ ：Reduced Representation
- 开销： $D_k*D_k*αM*ρD_F*ρD_F+αM*αN*ρD_F*ρD_F$
- $\in (0,1]$ ,使网络输入分辨率为224,192,160,128,降低输入图像的分辨率。

MobileNet V2

1.主要贡献

提出了一种倒置的线性瓶颈残差(inverted residual with linear bottleneck)
用 $1 \times 1$ 卷积层代替Relu6(普通的ReLU但是限制最大输出值为 6)

2.网络结构

MobileNet V1的结构如下图，没有residual并且带了Relu：
MobileNet V2的结构如下图，带了residual并且去掉了Relu:
- 原始的residual block:压缩->卷积特征提取->扩张
- Inversed residual :扩张(提升通道数，获取更多特征)->卷积提取特征->压缩
  - 去掉了Relu6直接线性输出的原因在于本来特征就已经被压缩了，若再经过Relu，又会损失一部分特征

参考博文
轻量级模型：MobileNet V2
MobileNetV1 & MobileNetV2 简介

ToLiveXX

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MobileNet V1 V2系列学习笔记

MobileNet 系列详解MobileNet V11.主要贡献提出了深度可分离卷积结构，大大减小了计算量和模型的大小。2.深度可分离卷积标准卷积的作用是过滤特征并合并，而深度可分离卷积将标准卷积的过滤与组合分开做，分解为：深度卷积(Depthwise) 和逐点卷积(Pointwise)。深度卷积对每个输入通道应用单个过滤器逐点卷积(1×1卷积)创建线性组合上图右边是深度可分离卷积对Depthwise和Pointwise两层都使用Batchnorm和Relu非线性激活3.深度可分离
复制链接

扫一扫

专栏目录