（科普快餐）语义分割经典论文--7：MobileNetV3(2019)

幼儿园级科研人士

已于 2022-11-30 10:40:24 修改

阅读量634

点赞数

文章标签：深度学习人工智能

于 2022-11-29 10:50:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51566363/article/details/128093573

版权

论文地址：http://openaccess.thecvf.com/content_ICCV_2019/papers/Howard_Searching_for_MobileNetV3_ICCV_2019_paper.pdf

意义

开发最佳的移动计算机视觉架构，优化移动设备上的精度权衡。为了实现这一点，引入了：

（1）互补搜索技术

（2）适用于移动环境的新型高效非线性

（3）新型高效网络设计

（4）新型高效分段解码器

改进

1. 加入SE模块

因为SE结构会消耗一定的时间，所以作者在含有SE的结构中，将expansion layer的channel变为原来的1/4,这样作者发现，即提高了精度，同时还没有增加时间消耗。

2. 修改尾部结构

在mobilenetv2中，在avg pooling之前，存在一个1x1的卷积层，目的是提高特征图的维度，更有利于结构的预测，但是这其实带来了一定的计算量了，所以这里作者修改了，将其放在avg pooling的后面，首先利用avg pooling将特征图大小由7x7降到了1x1，降到1x1后，然后再利用1x1提高维度，这样就减少了7x7=49倍的计算量。

为了进一步的降低计算量，作者直接去掉了前面纺锤型卷积的3x3以及1x1卷积，进一步减少了计算量，就变成了如下图第二行所示的结构，作者将其中的3x3以及1x1去掉后，精度并没有得到损失。这里降低了大约15ms的速度。

3. 修改了channel数量

修改头部卷积核channel数量，mobilenet v2中使用的是32 x 3 x 3，作者发现，其实32可以再降低一点，所以这里作者改成了16，在保证了精度的前提下，降低了3ms的速度。作者提供了两个版本的v3，分别是large和small，对应于高资源和低资源的情况。两者都是使用NAS进行搜索出来的。

4. 新激活函数

幼儿园级科研人士

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（科普快餐）语义分割经典论文--7：MobileNetV3(2019)

开发最佳的移动计算机视觉架构，优化移动设备上的精度权衡。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。