轻量检测模型PP-PicoDet解析

最新推荐文章于 2024-03-19 09:49:30 发布

00000cj

最新推荐文章于 2024-03-19 09:49:30 发布

阅读量1.2k

点赞数 18

分类专栏： Object Detection 文章标签：人工智能深度学习计算机视觉目标检测实时目标检测

本文链接：https://blog.csdn.net/ooooocj/article/details/135396042

版权

Object Detection 专栏收录该内容

43 篇文章 3 订阅

订阅专栏

Paper：PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

official implementation：https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.7/configs/picodet

Backbone

作者通过实验发现，ShuffleNetV2在移动设备上比其他网络更加鲁棒，为了进一步提升backbone的性能，作者在ShuffleNetV2的基础上借鉴了PP-LCNet（具体介绍见PP-LCNet 原理解析）的一些方法进行改进，构建了一个新的骨干网络Enhanced ShuffleNet (ESNET)。下图描述了ES Block的细节

具体而言，加入了SE module，和MobileNetV3一样，SE module两层激活函数分别为ReLU和H-Sigmoid。channel shuffle提供了通道的信息交换但会导致融合信息的丢失，为了解决这个问题，当stride=2时，加入了深度可分离卷积来整合不同通道的信息。GhostNet（具体介绍见GhostNet（CVPR 2020）原理与代码解析）提出的Ghost module可以用更少的参数生成更多的特征图以提高网络的学习能力，作者在stride=1的block中加入Ghost module进一步提高ESNet的性能。

Neck

neck部分采用CSP-PAN结构，在原始的CSP-PAN中，每个输出特征图的通道数和从backbone得到的输入是一样的，这对于移动设备来说计算成本太大，本文通过1x1卷积将输入C3~C5的通道数先降到最小的通道数即96。此外本文多添加了一层输出特征即P6来检测更多的对象。同时，除了1x1外的所有卷积都改成深度可分离卷积，并且将卷积核扩大到5x5来增大感受野。完整的结构如图2所示