MobileNet网络

最新推荐文章于 2024-06-11 11:15:04 发布

-断言-

最新推荐文章于 2024-06-11 11:15:04 发布

阅读量1.8k

点赞数 1

分类专栏：深度学习&图像处理文章标签：卷积网络神经网络深度学习

本文链接：https://blog.csdn.net/qq_44807176/article/details/112981789

版权

深度学习&图像处理专栏收录该内容

26 篇文章

订阅专栏

文章目录

1. MobileNet v1网络
2. MobileNet v2网络

1. MobileNet v1网络

1.1 MobileNet网络简介

传统卷积神经网络，内存需求大、运算量大导致无法在移动设备以及嵌入式设备上运行
在这里插入图片描述
MobileNet网络专注于移动端或者嵌入式设备中的轻量级CNN网络。相比于传统卷积神经网络，在准确率小幅降低的前提下大大减少模型参数与运算量（相比于VGG16准确率减少0.9%，但模型参数只有VGG的1/32）

1.2 网络亮点

DW卷积Depthwise Convolution （大大减少运算量和参数数量）
增加超参数 $\alpha$ 、 $\beta$
$\alpha$ 控制卷积层卷积核个数
$\beta$ 控制输入图像大小
$\alpha$ 和 $\beta$ 是人为设定的，而不是学习到的

下图为DW卷积
在这里插入图片描述

1.3 普通卷积、PW、DW的比较

1.3.1 传统卷积

卷积核channel=输入特征矩阵channel
输出特征矩阵channel=卷积核个数
在这里插入图片描述

1.3.2 DW卷积

卷积核channel=1
输入特征矩阵channel=卷积核个数=输出特征矩阵channel
在这里插入图片描述

1.3.3 PW卷积（实质是：卷积核大小为1的普通卷积）

卷积核channel=输入特征矩阵channel
卷积核大小为1
在这里插入图片描述

1.3.4 计算量的比较

DF：输入特征矩阵的高和宽
DK：卷积核大小
M：输入特征矩阵的深度
N：输出特征矩阵的深度（卷积核的个数）

普通卷积计算量： $D_K*D_K*M*N*D_F*D_F$
在这里插入图片描述

DW+PW卷积计算量:
$D_K*D_K*M*D_F*D_F+M*N*D_F*D_F=\frac{1}{N}+\frac{1}{D_K^{2}}=\frac{1}{N}+\frac{1}{9}$
在这里插入图片描述
理论上普通卷积计算量是DW+PW的8到9倍

1.4 MobileNet v1网络的模型结构

在这里插入图片描述

2. MobileNet v2网络

MobileNet v2网络由Google团队在2018年提出，相比MobileNet v1网络准确率更高，模型更小

2.1 网络亮点

Inverted Residuals（倒残差结构）
Linear Bottlenecks

2.2 Relu6激活函数

残差结构：采用ReLu激活函数
倒残差结构：采用Relu6激活函数
在这里插入图片描述
Relu6激活函数：

y = ReLU6(x) = min(max(x, 0), 6)
在这里插入图片描述
ReLU激活函数对低维特征信息造成大量损失，而对高维特征信息造成的损失较小

原文中针对倒残差结构的最后一个卷积层使用线性激活函数，而不是ReLU激活函数

原文实验：输入是二维矩阵，channel=1。采用不同维度的矩阵matrix T对输入矩阵进行变换，变换到更高的维度上。再使用ReLU激活函数得到输出值。再使用T矩阵的逆矩阵 $T^{-1}$ 将输出矩阵还原成二维的输入矩阵input。当T的矩阵为2或3时，还原成input时丢失了很多信息。