MatrixNets 论文笔记

MatrixNets是针对不同尺度和长宽比目标的CNN结构,解决了FPN无法有效处理长宽比目标的问题。通过矩阵结构的层,MatrixNets确保每个层的目标大小接近统一,提高了检测性能。它可应用于center-based和corner-based目标检测器,减少了参数数量并优化了目标检测的准确性。
摘要由CSDN通过智能技术生成

前言

如果说FPN是scale aware,即通过不同尺度的特征图实现对不同尺度目标的检测,那么本文提出的MatrixNets(xNets)就是scale and aspect ratio aware,与FPN的不同尺度相比,xNets多了一个长宽比,可以处理不同尺度和不同长宽比的目标。如下图所示,(a)是FPN,(b)是xNets,5个FPN层可以看作是xNets矩阵结构中对角线上的层,矩阵结构中的其它层是由对角线上的层经过下采样得到的。
在这里插入图片描述

FPN有什么缺点呢? 虽然FPN可以处理不同尺度的目标,但它并没有对不同长宽比的目标提出任何应对方法。比如说一座塔,或者一把小刀,它们明显是“瘦长”型的,那么是根据它们的长还是宽来把它们映射到不同层中呢?如果根据目标的长边来把它分配给某个层,那么这种暴力的下采样会导致短边信息的丢失。这个问题在MS-COCO数据集中是很普遍的,如下图所示,纵轴是目标的数量,横轴是目标的长边与短边的比值。作者发现,50%的目标的长短边的比值大于1.75,14%的目标的长短边的比值大于3,因此,对这些长宽比不同的矩形进行合理的建模对于提高检测性能是非常重要的
在这里插入图片描述

本文提出了MatrixNets(xNets),一种新的同时考虑尺度和长宽比的CNN结构,它将不同尺度和不同长宽比的目标分配到不同的层,使得每层的目标大小接近统一,这种分配使得所有长宽比和尺度的目标的信息可以被一视同仁。和FPN类似,xNets可以被应用到任何一个backbone中。

作者还考虑了xNets的两个应用,一个是在anchor-based one-stage目标检测器中使用xNets,另一个是在corner-based目标检测器中使用xNets,其实就是如何用xNets提高CornerNet结构。


MatrixNets

在这里插入图片描述
如上图所示,MatricNets使用矩阵结构的层为不同尺度和不同长宽比的目标建模,设 l i , j l_{i,j} li,j表示位于矩阵 i , j i,j i,j位置上的层,每个 l i , j l_{i,j} li,j对输入图像的宽度进行 2 i − 1 2^{i-1} 2i1倍的下采样,对高度进行 2 j − 1 2^{j-1} 2j<

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值