【域适应+clip十四】Open-Set Domain Adaptation with Visual-Language Foundation Models

motivation

无监督域自适应(UDA)是一种非常有效的方法,可以将具有标记数据的源域知识转移到具有未标记数据的目标域。由于目标域中缺乏标记数据以及可能存在未知类,开放集域适应(open-set domain adaptation, ODA)已成为在训练阶段识别这些类的潜在解决方案。虽然现有的ODA方法旨在解决源域和目标域之间的分布变化,但大多数方法在源域上对ImageNet预训练模型进行微调,并在目标域上进行自适应。

最近的视觉语言基础模型(VLFM),如对比语言图像预训练(CLIP),对许多分布变化具有鲁棒性,因此,应该大大提高ODA的性能。本文探索了将CLIP(一种流行的VLFM)用于ODA的通用方法。研究了利用CLIP进行zero-shot预测的性能,然后提出了一种熵优化策略来辅助ODA模型与CLIP的输出。

1.introduce

在这项工作中,重点是探索CLIP对ODA的潜力。具体来说,首先研究了CLIP在不同领域和数据集上对ODA的鲁棒性。然后,探索了一个使用CLIP的zero-shot预测来提高ODA绩效的框架。在本文的方法中,计算CLIP在目标域上输出的熵,将低熵的目标样本视为已知样本,而将高熵的目标样本视为未知样本。为了实现ODA,使用源样本训练另一种图像分类模型,称为ODA模型。对于检测到的目标域的已知样本,将CLIP的预测提取到ODA模型中,在ODA模型中,尝试使用CLIP的知识来帮助目标已知样本的适应。对于检测到的目标域的未知样本,通过最大化ODA模型的熵,将这些样本与已知样本进一步分离,其中ODA模型被训练以输出对这些未知样本的低置信度预测。通过将CLIP的输出与熵优化策略相结合,目标是为ODA模型提供更多的信息和判别特征,从而提高ODA的性能。

此外,由于ODA模型可以与目标域的自适应分开训练,因此在训练过程中不需要源样本和目标样本共存。这意味着本文的方法也可以应用于无源ODA (SF-ODA),其中目标样本的适应步骤只需使用ODA模型即可实现,无需访问源域数据。

本研究的贡献如下:

  1. 研究了从CLIP得到的zero-shot预测在ODA问题中的性能。
  2. 提出了一种用于CLIP预测的熵优化策略,以改进ODA模型对已知样本的分类和对未知样本的检测。
  3. 该方法不仅可以解决ODA问题,也适用于SF-ODA环境。通过几个领域适应的基准来评估本文的方法,本文方法在很大程度上优于其他现有的方法。

2.相关工作

上表总结了ODA和SF-ODA的几种不同主要方法。

2.1. 开集域自适应

源域和目标域的标签集分别记为Cs和Ct。UDA通常涉及闭集域自适应任务,其中Cs=Ct。在存在未知目标类的情况下,Cs是Ct的一个子集,因此提出了ODA作为解决现实场景中类不匹配问题的解决方案。

如[37]所提出的,ODA的一种潜在方法是在通用适应网络中使用源样本和目标样本的重要性加权。[26]引入的域自适应邻域聚类通过熵优化(DANCE),利用邻域聚类和熵分离来实现弱域对齐,从而获得较强的性能。最先进的ODA方法是由[27]开发的单对全网络(OV ANet),它使用标记的源数据为每个类训练单对全分类器,并通过最小化交叉熵使开集分类器适应目标域。

2.2. 无源域开放集域自适应

所有先前的UDA和ODA方法都要求在训练期间同时存在源样本和目标样本。这提出了一个重大的挑战,因为由于各种原因,可能无法访问标记的源数据。为了解决这些问题,针对无源UDA提出了源假设转移(source hypothesis transfer, SHOT)[13],它冻结了源模型的分类器模块,转而专注于通过利用信息最大化和自监督伪标记技术学习目标特定的特征提取模块。USFDA[12]利用类别可分性的知识来检测SFODA的未知样品。[36]提出的OneRing可以很容易地通过加权熵最小化来适应目标域,从而实现SF-ODA。

2.3. 视觉语言基础模型

近年来,由于从互联网上收集的大量图像-文本对的可用性,视觉语言基础模型得到了极大的关注。这些方法采用了多种预训练方案,包括对比学习[15]、掩码语言建模[30]和掩码区域建模[4]。

CLIP[21]是最近有代表性的预训练模型,旨在通过在图像-文本对的大规模数据集上训练来学习视觉和语言的联合表示。CLIP在几个视觉语言基准测试中取得了最先进的性能,并已被证明可以很好地推广到不同的数据集。此外,CLIP也被用于检测未知样本[16]。

  • 17
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值