【CVPR2023】在开放世界中检测一切:通用目标检测

论文题目:Detecting Everything in the Open World Towards Universal Object Detection

42acb4ff17654d61dae285ed425de087.png

代码:https://github.com/zhenyuw16/UniDetector

117e1c5d2be32a41278976a7da489d97.png

导读&动机

这篇论文来自清华&港大&meta,论文着眼于通用目标检测(Universal Object Detection)的问题,旨在实现在各种场景中检测各种目标的能力。这也是第一个正式解决通用目标检测问题的工作。

传统的目标检测方法依赖于大规模的标注数据集,但在开放世界中,出现新类别或新场景时,通常需要重新构建数据集,这限制了它们的泛化能力。

为了克服这一挑战,本文提出了UniDetector,这是一种通用目标检测框架,具备两项关键能力:

一是能够利用来自多个来源和异构标签空间的图像进行训练,以获得足够的信息进行泛化;

二是具有出色的开放世界泛化能力,可以预测未在训练中注释的新类别。

为实现这些能力,本文提出了一种分离的训练方法,以处理多源图像和异构标签,同时引入了概率校准方法来提高预测性能。实验证明,UniDetector在各个方面都表现出卓越的性能,是通用目标检测领域的一项重要创新。

本文贡献

  • 提出了UniDetector:UniDetector是一个通用目标检测框架,旨在解决通用目标检测的关键问题。UniDetector能够利用来自多个来源和异构标签空间的图像进行训练,并具备强大的开放世界泛化能力,可以预测未在训练中注释的新类别。

  • 分离训练策略:本文提出了一种分离的训练策略,将 proposal 生成阶段和 RoI(Region of Interest)分类阶段的训练分开。这种策略有助于模型更好地泛化到新类别,避免了在推理时偏向基本类别的问题。

  • 概率校准:引入了概率校准方法,用于平衡模型对不同类别的预测分布,并提高对新类别的预测性能。

相关工作

目标检测方法分类:目标检测方法通常可以分为两种类别:两阶段方法和一阶段方法。两阶段检测器&#x

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值