FCOS: Fully Convolutional One-Stage Object Detection论文笔记

论文下载地址:https://arxiv.org/pdf/1904.01355.pdf

论文代码:https://github.com/tianzhi0549/FCOS/

论文创新点:本文作者提出了一种基于特征图像素点的目标检测算法。对特征图的每一个点都会通过回归网络预测一个检测检测框。该算法的优点是计算量减少了(不需要计算过检测框和真实框的IOU),超参减少了(不需要考虑anchor的大小设置等参数)。

算法整体流程:

                                              图1.  算法的整体流程

       算法的整理结构如图1所示,主要由三部分组成。Backbone模块是基础网络结构,论文中使用的是Resnet-101,主要作用是提取特征图。Feature Pyramid模块主要作用是减少模糊框(后面会讲到什么是模糊检测框)的数量,提升检测精度。Classification+Center ness + Regression模块由三部分组成,这三个部分的作用分别是分类,减少低质量检测框,回归。算法的整体流程是:将图片传到Backbone网络里面提取一个通用特征图,然后建立一个5层的特征金字塔网络结构,随后每一层特征金字塔都会输出分类结果和回归的检测框。

        网络检测框的输出是一个四维向量4D(l,t,r,b),如下图所示。网络类别的输出是通过C个二分类来输出的检测结果的类别。在训练过程中,像素点落到ground_truth里面的都会被当作正样本,落到其他地方的都会被当作负样本。

特征金字塔:

       论文中提出特征金字塔的作用是解决模糊检测框问题。模糊检测框如下图2所示,在一个像素点出现了两个不同类别的不同大小的检测框这个就是模糊检测框,模糊检测框会导致歧义,降低算法的性能。

       特征金字塔是如何消除模糊检测框的?首先我们通过网络得到我们不同特征图上的检测框回归结果l,t,r,b。设置六个阈值分别是m2,m3,m4,m5,m6和m7,他们的值分别是0, 64, 128, 256, 512 and ∞。如果i层的检测框中max(l,t,r,b) > mi或者max(l,t,r,b) < mi-1说明这个检测框不满足当前特征图的要求就需要删除。也就是说在每一个特征图上都指定了不同大小的检测框,当出现模糊检测框的情况时回归距离不满足条件的检测框就会被舍弃。如果经过特征金字塔之后还存在模糊检测框问题,就选取最小的那个检测框作为最后的检测结果。

                   图2 . 模糊检测框

Center-ness 网络结构:

       对每一个像素点都进行检测框的预测势必会出现很多检测质量差的检测框出来。Center-ness网络结构的作用就是删除那些质量差的检测框。

      如下图所示以检测对象为中心(深颜色区域,通过Center-ness预测一个中心点),向外发展权重(权重计算=像素距离中心点归一化的值*类别的概率)会越来愈低,以至于远离目标的检测框权重会越来越小。这样再通过NMS就可以消除远离目标区域的检测框了。

结果:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值