anchor free 目标检测_FCOS:简洁有效的anchor-free目标检测器

最新推荐文章于 2023-04-09 00:44:10 发布

weixin_39654903

最新推荐文章于 2023-04-09 00:44:10 发布

阅读量378

点赞数

文章标签： anchor free 目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39654903/article/details/112369696

版权

FCOS是一种anchor-free目标检测方法，通过全卷积网络进行逐像素预测，避免了anchor相关的超参数调整和计算量。采用多级预测提高召回率，并引入center-ness分支抑制低质量边框，简化了检测算法框架。

摘要由CSDN通过智能技术生成

论文题目:FCOS: Fully Convolutional One-Stage Object Detection

其亮点:

基于FCN构建全卷积检测器,使得视觉任务(如语义分割)可以统一在FCN框架
anchor-free,proposal free,避免了训练阶段关于anchor或者proposal的iou计算.更重要的是,避免了一切与anchor有关的超参数
简单的Backbone;neck;head检测算法框架

原始anchor-base的缺点:

检测器对anchor的大小、纵横比、数量比较敏感;在RetinaNet,更改这些超参数会影响性能高达4% ap(coco基准).因此在使用基于anchor的检测器时要仔细调关于anchor的超参数
由于anchor的比例和纵横比在初始时保持固定,检测器在处理形状变化较大的候选对象时能力不够
为了实现较高的召回率,anchor-base的检测器将anchor密集地放置在图像特征中,导致训练过程加大了正负样本的不平衡,当然也显著增加训练过程的计算量(一般通过计算与GT之间的IOU来计算loss,anchor生成的proposal越多,计算量就越大)

本文方法:

逐像素回归预测

信息表示:

对于训练目标ground-truth bounding boxes,我们用其四元向量表示:

其中

代表了边框的左上角点坐标,

代表了边框的右上角坐标,

代表了其目标框的类别.

backbone CNN网络提取的特征图

属于第

层,其中缩放的步幅(stride)为

. 对于特征图中的每一对坐标点

,我们可以与原始图像建立一一对应关系

;

不同于anchor-base的检测器,fcos对每一个特征图上的坐标

都作为训练样本进行回归(也就是像素级别回归).

如同上面的对应关系,如果(x,y)落在任何一个ground-truth bounding box中,那么它是一个正训练样本,其标签是ground-truth的标签

,如果不落在box中,则该样本则为负样本,

.

除此之外,fcos还对每一个像素进行回归预测一个四元组向量

,分别代表了其四个边框到中心点的距离;

某个点落入边框

内,则回归的目标为:

最低0.47元/天解锁文章

weixin_39654903

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。