跨域小样本---cross domain few shot---第二弹

简单来说就是在Few-shot Learning问题中加入了跨域问题,具体表现在:在一个数据集上进行Few-shot训练,完成后在另一个数据集Few-shot测试,两个数据集中没有相同的类别。

  1. 跨域小样本—cross domain few shot—第一弹

Universal Representation Learning from Multiple Domains for Few-shot Classification (ICCV2021)

问题: 现有解决方案首先会在多个数据集分别训练特征提取器,随后在测试阶段筛选或者融合来自不同提取器的特征,如下图(a)所示,但是针对小样本场景中样本少的问题导致筛选、融合过程难以实现。
创新点: 本文使用对多个特征提取器进行知识蒸馏,从而避免了测试过程中的筛选、融合步骤,下图(b)所示。

具体框架图:

  1. 第一阶段,首先在每个域训练对应的特征提取器 f ϕ ∗ f_{{\phi}^*} fϕ域分类器 h ψ ∗ h_{{\psi}^*} hψ
  2. 第二阶段,将所有的 f ϕ ∗ f_{{\phi}^*} fϕ h ψ ∗ h_{{\psi}^*} hψ冻结,然后使用知识蒸馏来学习 f ϕ f_{\phi} fϕ
    2.1 特征约束: 在知识蒸馏阶段,每个域图像分别进入各自的特征提取器 f ϕ k ∗ f_{{\phi}_k^*} fϕk,并进入 f ϕ f_{\phi} fϕ f ϕ f_{\phi} fϕ的输出特征会进入对应的域适配器 A θ k A_{{\theta}_k} Aθk进行线性变换。最后使用CKA (一种骚距离度量) f ϕ k ∗ f_{{\phi}_k^*} fϕk A θ k A_{{\theta}_k} Aθk的输出进行约束。
    2.2 结果约束: f ϕ f_{\phi} fϕ的输出输入到对应的 h ψ k h_{{\psi}_k} hψk中得到分类结果, f ϕ k ∗ f_{{\phi}^*_k} fϕk的输出输入到冻结的 h ψ k ∗ h_{{\psi}^*_k} hψk得到分类结果,计算两种结果的KL损失。
  3. 两种约束能够在不同层面上帮助网络进行知识蒸馏,在测试阶段使用 f ϕ f_{\phi} fϕ作为特征提取器,在support-set上训练一个 A ϑ A_{\vartheta} Aϑ,最后参考Few-shot分类范式,使用 f ϕ f_{\phi} fϕ A ϑ A_{\vartheta} Aϑ完成query-set的分类。

Cross-domain Few-shot Learning with Task-specific Adapters (CVPR2022)

跟上一篇出自同一个团队 (很专注)
创新点: 去除了迁移过程中繁琐的adapter步骤,将task adaptation依附在训练过程中,在训练过程中完成适配。

具体框架:

  1. 在ImageNet上训练得到特征提取器 f ϕ f_{\phi} fϕ

  2. support-set中,在冻结的 f ϕ f_{\phi} fϕ的各个层间加入 task-specific weights: ϑ \vartheta ϑ,具体是加入各种变换。将经过这些变换后得到的特征输入到分类器 p ( ϕ , ϑ ) p_{(\phi,\vartheta)} p(ϕ,ϑ)中进行分类。

  3. 超级总结: 在冻结的特征提取器 f ϕ f_{\phi} fϕ的层之间加入 1 × 1 1\times1 1×1卷积,并最后一层再加入线性变换器 A β : R d → R d A_{\beta}:R^d\rightarrow R^d AβRdRd。这些简单的操作,再Few-shot setting下就有了神奇的魔力。因为Few-shot是基于episodes训练的,所以训练过程中这些 1 × 1 1\times1 1×1卷积层与最后的变换器拟合了大量的task,具备了元迁移的能力(非常玄乎),为什么有效呢?我认为这种设定,在单domain训练中能够起到增强特征的作用,类似增加一些扰动进去,会增强特征的泛化性;在多domain训练中,由于episodes训练的原因,网络能够收集不同域的经验,起到文中提到的适配的作用,最终适配不同域的数据。

跨域数据集

多源域自适应矩阵匹配:Moment Matching for Multi-Source Domain Adaptation,ICCV2019

收集并注释了迄今为止最大的UDA数据集DomainNet,存在显著的领域差距和大量的类别,它包含6个域和分布在345个类别中的约60万幅图像。
在这里插入图片描述

Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples(ICLR )

相较于上一篇,数据集是按领域来划分,即数据集间没有类别交叉
在这里插入图片描述

MSeg: A Composite Dataset for Multi-domain Semantic Segmentation

综合好几个分割数据集(多数为街景)为一个大的数据集,将类别进行了更加精细的处理。
在这里插入图片描述

  • 14
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值