MobileNet详解

最新推荐文章于 2024-07-14 16:32:04 发布

等待整个冬天

最新推荐文章于 2024-07-14 16:32:04 发布

阅读量90

点赞数

文章标签：卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52631753/article/details/134320063

版权

MobileNet

视频地址：霹雳吧啦Wz.7.1 MobileNet网络详解

1.模型概述：

专注于移动端或者嵌入式设备中的轻量级CNN网络
比传统CNN准确率小幅降低，大大减少模型参数与运算量

2.网络亮点：

Depthwise Convolution(减少参数和运算量)
增加超参数α(控制卷积层、核数量)、β(控制输入图像尺寸)，这两个超参数是人为设定的

3.传统卷积与MobileNet-V1（深度可分离卷积）

传统卷积

在这里插入图片描述

特点：

在这里插入图片描述

输入通道=3=卷积核通道数，卷积核个数=4=输出通道数

每个卷积核都是3通道，与特征图的每个通道进行卷积

Depthwise Separable卷积由两部分组成：

DW卷积（depthwise conv）

特点：

每个卷积核只有一个通道，只负责输入特征图一个通道的卷积

Depthwise convolution和标准卷积不同，对于标准卷积其卷积核是用在所有的输入通道上（input channels），而depthwise convolution针对每个输入通道采用不同的卷积核，就是说一个卷积核对应一个输入通道，所以说depthwise convolution是depth级别的操作

PW卷积（pointwise conv）

在这里插入图片描述

在传统的卷积上，卷积核kernel_size=1x1

在这里插入图片描述

4.对比普通CNN和depthwise separable卷积的计算量：

输入特征:DFxDFxM

输出特征：DFxDFxN

对于标准卷积DKxDK计算量

DF x DF x M x N x DK x DK

对于深度可分离卷积计算量：

对于depthwise convolution：DF x DF x M x DK x DK
对于pointwise convolution： DF x DF x M x N

在这里插入图片描述

采用3x3卷积核的话，depthwise separable convolution相较标准卷积可以降低大约9倍的计算量

5.MobileNet网络架构及超参数α、β

s2:stride=2

3x3x3x32：kernel_size=3,input_channel=3,output_channel=32

基本结构

两个超参数α(Width Multiplier)、β(Resolution Multiplier)：

α代表的是卷积核个数的倍率因子，控制卷积核个数,即按比例减少通道数，输入与输出通道数变成αM和αN

对于深度可分离卷积，其计算量变为
β代表的是分辨率的倍率因子，输入不同尺寸的图像会有不同的准确率

比如原来输入特征图是224x224，可以减少为192x192，计算量变为

6.MobileNet-V2

亮点：

Inverted Residual(倒残差结构)
Linear Bottlenecks

倒残差结构

在这里插入图片描述

residual block

两头大中间小，使用1x1卷积核降维，减少通道数，然后用3x3卷积，再使用1x1卷积升维

使用ReLu激活函数

倒残差结构

两头小中间大，先用1x1卷积升维，再用3x3DW卷积，最后用1x1卷积降维

使用ReLu6激活函数

Linear Bottlenecks

针对倒残差结构中最后1×1卷积层，使用了线性激活函数，而不是relu激活函数。因为relu激活函数对于低维度特征信息会造成大量损失。对于维度较低的，乘以矩阵后经relu再还原效果差，维度较高的相对好。倒残差结构是两头小中间大。

参考详解MobileNetV2

在这里插入图片描述

什么时候有捷径分支？

当stride=1且输入特征矩阵与输出特征矩阵shape相同时

网络结构

在这里插入图片描述

1.s代表的是步距，有的bottleneck需要重复两次，两次中只有第一次s是为2的，这个根据Input的特征图大小也能判断出来

2.t代表是扩展因子。这个在上图中的表格也可以看到

3.最后一行k代表的就是分类类别个数，

参考：

[2] 小小将.CNN模型之MobileNet[EB/OL].[2023.11.9].https://www.zhihu.com/people/xiaohuzc/posts.

2.t代表是扩展因子。这个在上图中的表格也可以看到

3.最后一行k代表的就是分类类别个数，

参考：

[2] 小小将.CNN模型之MobileNet[EB/OL].[2023.11.9].https://www.zhihu.com/people/xiaohuzc/posts.

卷积神经网络中的Separable Convolution-参数对比

等待整个冬天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
MobileNet详解

专注于移动端或者嵌入式设备中的轻量级CNN网络比传统CNN准确率小幅降低，大大减少模型参数与运算量。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

等待整个冬天 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。