Searching for MobileNetV3笔记

最新推荐文章于 2024-05-28 09:35:36 发布

lichar03

最新推荐文章于 2024-05-28 09:35:36 发布

阅读量1.1k

点赞数

分类专栏：渣渣读论文

本文链接：https://blog.csdn.net/lichar03/article/details/90213868

版权

渣渣读论文专栏收录该内容

2 篇文章 1 订阅

订阅专栏

Searching for MobileNetV3笔记

hexo?:https://licharyuan.github.io/2019/05/13/MobileNetV3/

arxiv

本笔记将回顾V1，V2的知识以及介绍V3的特点。

知识回顾
- MobileNet V1
- MobileNet V2
MobileNetV3
- 相关技术
- 文章

知识回顾

MobileNet V1

提出了depthwise的卷积结构加速CNN的训练，depthwise的操作就是将通道全部独立开做卷积期间通道数不变，可以理解为Group=In_channels的Group Conv；然后再用1x1的卷积实现通道之间的融合。这种方式会比直接卷积省去很多参数。

MobileNet V2

为了解决v1一些卷积核训废的问题，原因为当通道数比较少的时候，ReLU激活函数会造成较多信息的丢失（具体去看文章的论证）。于是提出了linear bottleneck layer和inverted residual block，[Input]->[1x1 conv 增加通道]-> [ReLU6]->[depthwise conv]->[ReLU6]->[1x1 conv降低通道数]->[Linear]+[Input]不再接ReLU层，这里作者应该做了很多对比实验才得出了比较优的结构。

MobileNet V3

文章

当然也有原创的一些方法，下面就是V3做的特定的优化。

重新设计计算密集层

在基于MobileNet V2的模型中inverted bottleneck structure and variants 是用1x1 conv来拓展到更高维的特征空间，这层带来了往外的latency。为了减少latency且保留高维特征，V3把1x1移动到平均池化之后。现在计算的分辨率由7x7变成了1x1，那么之前为了减少计算建立的瓶颈层也不需要了。改变前后的比较图：
原先用的是32个3x3的卷积来构建初始滤波器的边缘检测。很多特征图都是彼此的镜像，所以V3砍掉了一半，用16个，参数少了也不用使用激活层了。

激活函数的设定

改进了swish的激活函数，swish虽然可以用来提高精度，但是带来的计算量太大的。V3提出了h-wish，来作为V3激活函数的一种。

文章中对比这两种激活函数的曲线，两个是相近的。 swish_vs_hswish 实验发现，这种激活函数的改变在网络的深层能够更有效的减少网络的参数量。表格1和表格2列出了两种MobileNetV3所采用的结构。MobileNetV3的large和small分别对应高低资源消耗。

MobileNetV3

实验结果

这一段就大概提一下吧，因为比较detail，仔细看原文的一些改动还有参数的设定会比较好。

对比了不同width-multipliers的试验结果，在不同机器下测试了large和small的延时。
对比了不同激活函数的结果（精度和延时）
各个组成部分的消融学习（有没有NetAdapt/SE/h-wish等）
目标检测
- 把MobileNet V3作为 SSD-Lit的backbone feature extractor，对比其他网络作为backbone feature extractor，效果不错，延时下降了很多
语义分割
- 提出了Lite R-ASPP，相比R-ASPP有一些结构上的调整。比如用了更大的stride，空洞卷积，加入了skip connection之类的小改动。文章由结构图。