MatrixNets 论文笔记-CSDN博客

本文链接：https://blog.csdn.net/qq_30146937/article/details/104561260

MatrixNets是针对不同尺度和长宽比目标的CNN结构，解决了FPN无法有效处理长宽比目标的问题。通过矩阵结构的层，MatrixNets确保每个层的目标大小接近统一，提高了检测性能。它可应用于center-based和corner-based目标检测器，减少了参数数量并优化了目标检测的准确性。

摘要由CSDN通过智能技术生成

前言

如果说FPN是scale aware，即通过不同尺度的特征图实现对不同尺度目标的检测，那么本文提出的MatrixNets（xNets）就是scale and aspect ratio aware，与FPN的不同尺度相比，xNets多了一个长宽比，可以处理不同尺度和不同长宽比的目标。如下图所示，（a）是FPN，（b）是xNets，5个FPN层可以看作是xNets矩阵结构中对角线上的层，矩阵结构中的其它层是由对角线上的层经过下采样得到的。
在这里插入图片描述

FPN有什么缺点呢？ 虽然FPN可以处理不同尺度的目标，但它并没有对不同长宽比的目标提出任何应对方法。比如说一座塔，或者一把小刀，它们明显是“瘦长”型的，那么是根据它们的长还是宽来把它们映射到不同层中呢？如果根据目标的长边来把它分配给某个层，那么这种暴力的下采样会导致短边信息的丢失。这个问题在MS-COCO数据集中是很普遍的，如下图所示，纵轴是目标的数量，横轴是目标的长边与短边的比值。作者发现，50%的目标的长短边的比值大于1.75，14%的目标的长短边的比值大于3，因此，对这些长宽比不同的矩形进行合理的建模对于提高检测性能是非常重要的。
在这里插入图片描述