Importance Weighted Adversarial Nets for Partial Domain Adaptation学习笔记

Importance Weighted Adversarial Nets for Partial Domain Adaptation学习笔记

Abstract

本文提出了一种基于重要性加权对抗网络的无监督域自适应方法,特别适用于部分域自适应,其中目标领域比源领域拥有更少的类别。

introduce

作者假设目标域的样本均未标注,而且目标域所有的类别都能在源域中找到,即目标域的类别空间是源域类别空间的子集。但是这时候如果直接进行迁移无法有效减小两个域之间的域偏移,因为两个域的标签空间不同,所以域之间的边缘分布本质上也不相同。

在这种情况下,从源域迁移到目标域的一种可行的方式是在分布匹配过程中对于可能出现在目标域的源域类别,对属于该类别的源域样本进行重新加权。然而,目标域是未标注的,揭示哪些类被呈现以及哪些源域样本对于迁移任务是重要的并不简单。针对这一问题,本文提出了一种基于加权对抗网络的深度域适应方法

基于加权对抗网络的深度域适应方法中包括一个特征提取器以及一个域分类器。其中特域分类器旨在识别源域样本和目标域样本分布之间的差异,以找到真实领域分布散度的更紧密的下界;而特征提取器通过向与域分类器相反的方向步进来减少分布的发散

本文提出使用使用两个域分类器来获得源域样本的重要程度得分。形象地说,在给定任意一个特征提取器的时候,第一个域分类器输出的最优参数给出了样本来自源域的概率,如果第一个域分类器的激活很大,那么这时候的样本很可能属于两个域共享类别之外的类别。因此,使用第一个域分类器的激活作为每个源域样本对目标域重要性的指示。然后,将所学习的权重应用于源域样本,并且将加权的源域样本和目标域样本送到第二个域分类器,用于优化特征提取器。

作者已经表明,特征提取器和第二个域分类器之间的最小最大博弈在理论上等价于减少加权源密度和目标密度之间的詹森-香农散度

related work

减小域间差异的方法目前主要有三种:

  1. 基于统计矩匹配的方法: maximum mean discrepancy (MMD)、Central Moment Discrepancy (CMD)
  2. 基于对抗损失的方法:鼓励来自不同领域的样本对领域标签不加区分
  3. 基于正则化的方法:将源域和目标域样本的分布对齐

然而,所有这些方法都依赖于特征空间中边缘分布的匹配,因此为了进行可行的适应,域之间的标签空间都被假定为相同的。

Proposed Method

源域的样本集定义为 X s ∈ R D × n s X_s\in \mathbb{R}^{D\times n_s} XsRD×ns,源域样本的分布为 P s ( x ) P_s(x) Ps(x);目标域的样本集定义为 X t ∈ R D × n t X_t\in \mathbb{R}^{D\times n_t} XtRD×nt,目标域域样本的分布为 P t ( x ) P_t(x) Pt(x)。D表示数据的维度, n s n_s ns n t n_t nt分别表示两个域的样本数量。

源域表示为 D s = { ( x i s , y i s ) i = 1 n s } , x i s ∈ R D D_s=\{(x^s_i,y^s_i)_{i=1}^{n_s}\},x^s_i\in \mathbb{R}^D Ds={ (xis,yis)i=1ns},xisRD目标域表示为 D t = { ( x j t ) j = 1 n t } , x j t ∈ R D D_t=\{(x^t_j)^{n_t}_{j=1}\},x^t_j \in \mathbb{R}^D Dt={ (xjt)j=1nt},xjtRD.

源域与目标域的特征空间假设一致: X s = X t \mathcal{X}_s=\mathcal{X}_t Xs=Xt,目标域标签空间是源域标签空间的子集: Y t ⊆ Y s \mathcal{Y}_t \sube \mathcal{Y}_s YtYs

framework
image-20201111102653539

绿色部分是源域与目标域的特征提取器。图中阴影部分表示参数经过了预训练,在训练过程中不会更新。蓝色部分表示第一个域分类器,来获得源域样本的重要性权重。红色部分表示第二个域分类器,用来与带权重的源域样本、目标域样本进行minimax game。GRL表示梯度反转层,在后向传播中改变梯度的符号。

Adversarial Nets-based Domain Adaptation

作者使用了类似论文《Unsupervised domain adaptation by backpropagation》、《Adversarial discriminative domain adaptation》中的前馈网络中域分类器,同时学习区分类别的特征和域不变特征,其中源域数据的标签预测器的损失最小,而域分类器的损失最大。

本文中基于对抗网络的域适应框架与传统GAN相似:

min ⁡ F s , F t max ⁡ D L ( D , F s , F t ) = E x ∼ p s ( x ) [ l o g ( D ( F s ( X ) ) ) ] + E x ∼ p

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值