论文题目:Detecting Everything in the Open World Towards Universal Object Detection
![42acb4ff17654d61dae285ed425de087.png](https://img-blog.csdnimg.cn/img_convert/42acb4ff17654d61dae285ed425de087.png)
代码:https://github.com/zhenyuw16/UniDetector
![117e1c5d2be32a41278976a7da489d97.png](https://img-blog.csdnimg.cn/img_convert/117e1c5d2be32a41278976a7da489d97.png)
导读&动机
这篇论文来自清华&港大&meta,论文着眼于通用目标检测(Universal Object Detection)的问题,旨在实现在各种场景中检测各种目标的能力。这也是第一个正式解决通用目标检测问题的工作。
传统的目标检测方法依赖于大规模的标注数据集,但在开放世界中,出现新类别或新场景时,通常需要重新构建数据集,这限制了它们的泛化能力。
为了克服这一挑战,本文提出了UniDetector,这是一种通用目标检测框架,具备两项关键能力:
一是能够利用来自多个来源和异构标签空间的图像进行训练,以获得足够的信息进行泛化;
二是具有出色的开放世界泛化能力,可以预测未在训练中注释的新类别。
为实现这些能力,本文提出了一种分离的训练方法,以处理多源图像和异构标签,同时引入了概率校准方法来提高预测性能。实验证明,UniDetector在各个方面都表现出卓越的性能,是通用目标检测领域的一项重要创新。
本文贡献
提出了UniDetector:UniDetector是一个通用目标检测框架,旨在解决通用目标检测的关键问题。UniDetector能够利用来自多个来源和异构标签空间的图像进行训练,并具备强大的开放世界泛化能力,可以预测未在训练中注释的新类别。
分离训练策略:本文提出了一种分离的训练策略,将 proposal 生成阶段和 RoI(Region of Interest)分类阶段的训练分开。这种策略有助于模型更好地泛化到新类别,避免了在推理时偏向基本类别的问题。
概率校准:引入了概率校准方法,用于平衡模型对不同类别的预测分布,并提高对新类别的预测性能。
相关工作
目标检测方法分类:目标检测方法通常可以分为两种类别:两阶段方法和一阶段方法。两阶段检测器&#x