FoveaBox：目标检测新纪元，无Anchor时代来临

最新推荐文章于 2023-04-11 16:16:41 发布

hcgx2018

最新推荐文章于 2023-04-11 16:16:41 发布

阅读量294

点赞数

分类专栏：人工智能深度学习文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hcgx2018/article/details/93754346

版权

FoveaBox是一种新颖的目标检测算法，源自人眼中央凹的灵感，抛弃了Anchor设计，简化了网络结构，实现了state-of-the-art的检测效果。它在RetinaNet基础上改进，通过直接预测每个位置的类别置信度和边界框实现目标检测。实验结果显示，FoveaBox在精度和目标候选框质量上优于RetinaNet和RPN，并在COCO数据集上展现出强大的竞争力，具有很大的发展潜力。

摘要由CSDN通过智能技术生成

今天跟大家分享的FoveaBox则是该方向最新的成果，针对的是通用目标检测领域，算法方案简单，结果达到state-of-the-art，代码亦将开源，方便后续其他学者跟进，发展空间极大。

算法思想

FoveaBox的动机来自人眼的中央凹：视野中心（物体）具有最高的视力。
（物体的位置信息能够从中心反应出来——CV君的理解）
下图展示了FoveaBox目标检测的基本思想，对于可能存在目标的每个输出空间位置，FoveaBox直接预测所有目标类别存在的置信度和边界框。

在这里插入图片描述

FoveaBox是在RetinaNet目标检测网络基础上做的改进，我们先来看看RetinaNet的网络架构。
如下图，RetinaNet利用了特征金字塔网络检测目标，对于金字塔的每一层，都后接class + box 子网络。最右侧上半部分为class子网络，下半部分为box子网络。

在这里插入图片描述

下图是FoveaBox网络的改进，class 子网络计算的是每个输出位置分别存在不同类别目标的置信度，box子网络则是直接计算每个输出位置的与类别无关的目标包围框（左上和右下顶点坐标）。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。