1. MS-Block介绍
1.1 摘要:我们的目标是为目标检测社区提供高效且高性能的目标检测器,称为 YOLO-MS。 核心设计基于对不同内核大小的卷积如何影响不同尺度的物体检测性能的一系列研究。 结果是一种新策略,可以强烈增强实时对象检测器的多尺度特征表示。 为了验证我们策略的有效性,我们构建了一个网络架构,称为 YOLO-MS。 我们从头开始在 MS COCO 数据集上训练 YOLO-MS,而不依赖于任何其他大型数据集(例如 ImageNet)或预训练权重。 在没有花里胡哨的情况下,当使用相当数量的参数和 FLOP 时,我们的 YOLO-MS 优于最新最先进的实时目标检测器,包括 YOLO-v7 和 RTMDet。 以YOLO-MS的XS版本为例,仅4.5M可学习参数和8.7G FLOPs,在MS COCO上即可达到43%+的AP分数,比同模型的RTMDet高出约2%+ 尺寸。 此外,我们的工作还可以用作其他 YOLO 模型的即插即用模块。 通常,我们的方法使用更少的参数和 FLOP 显着地将 YOLOv8 的 AP 从 37%+ 提高到 40%+。
官方论文地址: