原论文摘要
MobileNetV3通过结合硬件感知网络架构搜索(NAS)和NetAdapt算法,通过新颖的架构改进进一步提升了性能。本文开始探讨了自动化搜索算法与网络设计如何协同工作,以利用互补方法来提升整体技术水平。通过这一过程,创建了两个新的MobileNet模型:MobileNetV3-Large和MobileNetV3-Small,分别针对高资源和低资源使用场景。这些模型随后被适配并应用于目标检测和语义分割任务。对于语义分割(或任何密集像素预测)任务,提出了一种新的高效分割解码器——Lite Reduced Atrous Spatial Pyramid Pooling(LR-ASPP)。我们在移动端的分类、检测和分割任务中取得了新的最先进的成果。相比于MobileNetV2,MobileNetV3-Large在ImageNet分类上精度提高了3.2%,同时延迟减少了15%;MobileNetV3-Small的精度提高了4.6%,而延迟减少了5%。在COCO检测任务中,MobileNetV3-Large的检测速度比MobileNetV2快25%,而精度几乎相同。对于Cityscapes分割任务,MobileNetV3-Large LR-ASPP比MobileNetV2 R-ASPP快30%,且精度相近。
MobileNetV3理论详解可以参考链接:论文地址
MobileNetV3代码可在这个链接找到:论文地址
本文在YOLOv8中的主干网络替换成MobileNetV3,实现了大幅度涨点+轻量化架构,代码已经整理好了,跟着文章复制粘贴,即可直接运行
改进前训练结果:
改进后训练结果: