论文题目:Multi-view Adversarial Discriminator: Mine the Non-causal Factors for Object Detection in Unseen Domains
代码:https://github.com/K2OKOH/MAD
导读
这篇论文探讨了一个具有挑战性的问题,即如何在实际应用中将目标检测模型适应到未知的目标领域。在传统的目标检测方法中,通常基于独立同分布(i.i.d.)的假设,即训练和测试数据集具有相同的分布。然而,在现实世界中,这一假设很难成立,因为目标领域的分布通常与源领域不同,这被称为域漂移,而目标检测模型在面对域漂移问题时性能急剧下降。
为了解决这个问题,本文提出了一种全新的方法,称为Multi-view Adversarial Discriminator(MAD),旨在从多个视图中鉴别特征,以去除非因果因素并净化共同特征。为了增加源领域的多样性,作者还引入了一个Spurious Correlation Generator(SCG)。通过将MAD与SCG结合,研究人员构建了一个能够有效处理域漂移问题的新型域泛化模型。
本文贡献
非因果因素的识别和去除:MAD方法通过多个视角观察源域特征,并将这些特征映射到不同的潜在特征空间(视角),以识别和去除在不同视角中非显著的非因果因素。这有助于提取更纯净的领域不变特征。
模块设计:MAD模型包括两个关键模块,一个是假相关生成器(SCG),用于增加源域数据的多样性,另一个是多视图域分类器(MVDC),用于将特征映射到多个潜在空间。这两个模块协同工作,提高了非因果因素的剔除能力。
实验证明:论文通过在六个标准数据集上进行大量实验,证明了MAD算法在目标检测任务中具有最佳的泛化性能,相对于传统方法取得了显著的性能提升。
相关工作
域自适应目标检测(Domain Adaptive Object Detection,DAOD)
目标检测是计算机视觉中的一个重要问题,旨在在图像中定位和分类指定的对象实例。现代目标检测方法可以分为一阶段方法和二阶段方法。传统目标检测方法在实际应用中受到域偏移的困扰,导致性能下降。
为了减轻由领域偏移引起的性能下降,提出了许多域自适应目标检测方法(DAOD),这些方法通过领域对抗学习(DAL)从有标签的源域和无标签的目标域中训练模型,以缓解领域偏移问题。DAOD方法可以分为基于对抗的方法和基于重建的方法。前者引入了领域对抗学习结构来对齐特征图,后者通过生成类似目标域的伪样本来解决问题。
然而,DAOD方法仍然存在一些问题,如需要额外收集无标签目标域数据,以及不能保证特征的因果性。因此,本文希望找