迁移学习“Partial Transfer Learning with Selective Adversarial Networks”

Partial Transfer Learning with Selective Adversarial

Networks

摘要:对抗学习应用于深度网络中学习可迁移的特征初有成效,它降低了源域及目标域之间的分布差异。目前已有的对抗网络假设源域和目标域共享全部的标记空间。在迁移过程中,源域中类别往往很多,而目标域通常只和源域其中一小部分相关,直接迁移肯定会产生负迁移的影响。论文提出了部分迁移学习,减轻了标记空间的约束,目标域标记空间可以仅是源域的子集。论文提出的网络称为选择性对抗网络(SAN),通过挑选出源域中outlier类减轻负迁移影响,并在共享的标记空间中最大化匹配数据分布提升正迁移的影响。

 

从大数据的角度来看,可以假设源域中大规模训练集包含了目标域的所有类别,目标域的label仅是源域的子集,如图1所示,源域中的outlier(‘sofa’)将产生负迁移。

 

 

方法描述

部分迁移学习目标域标记空间是源域标记空间的子集,,实际应用中也是经常由大数据集(如ImageNet)向小数据集(CIFAR10)迁移。假设源域包含类共个样本,目标域包含类共个未标记的样本。源域和目标域的采样概率分别为p和q,迁移学习中,部分迁移学习。本文的目标是设计网络学习迁移特征及自适应分类器建立跨域差异的桥梁,通过源域的监督学习最小化目标风险:

 

迁移学习中,主要的挑战是目标域没有标记数据,由于分布差异,源域中学习到的分类器不能直接用于目标域。在部分迁移学习中,源域中哪部分的label与目标域共享也不知道。一方面,源域中属于outlier的标记数据将导致负迁移;另一方面,降低t与q间的分布差异在知识迁移中比较关键。

 

  1. 域对抗网络

对抗学习是双人游戏,其中一个是域分辨器,用于分辨源域和目标域,另外一个是特征提取器,目的是迷惑域分辨器。

为提取域不变的特征f,特征提取器的参数θf通过最大化域分辨器Gd的损失学习,域分辨器的参数通过最小化域分辨器的损失学习,同时最小化label预测器的损失。域对抗网络的目标函数为:

 (1)

收敛时,网络参数满足:

 (2)

对于标准迁移学习,源域与目标域标记空间相同的情况,域对抗网络性能较好。

  1. 选择性对抗网络

目标域标记空间是源域的子集,outlier label空间越大,负迁移情况越严重,论文将outlier的源域类别选出去解决负迁移问题。

为匹配具有不同标记空间的域,将域分辨器分离成个类别级域分辨器,k=1,…,Cs,每个负责label为k的源域和目标域数据匹配,如图2所示。由于目标域标记在训练中不可访问,决定哪个域分辨器对每个目标域数据负责并不容易。而label预测器的输出是源域标记空间的概率分布,该分布描述了该分为中的哪一类。可以使用作为将分配给某个域分辨器,的概率。这样生成概率加权的域分辨损失:

(3)

其中是第k个域分辨器,是交叉熵损失,xi的域标记。多分辨器域对抗网络可以进行细粒度的自适应,每个数据仅与相关的域分辨器匹配。

同时降低源域中outlier类的域分辨器,对域分辨器进行类别级的加权:

(4)

其中,是k类的类别级权值,对于outlier类别来说很小。

多域分辨器对概率依赖程序比较高,使用熵最小化准则调整类别预测器,使得类间低密度分离,通过最小化概率yik在目标域上的条件熵实现:

 (5)

其中是条件熵损失函数。通过最小化熵(5),label预测器可以直接访问目标域未标记的数据。

最终的目标函数为:

总的来说,SAN的思想是让 通过有监督的方式优化标签预测器,最小化预测损失值,让网络根据 尽可能分类好样本,同时又要让域判别器的损失最大化,以至于域判别器能够更准确的判断出 是属于所有类别k中的哪一类,好给样本分配权重,让属于与目标域相关的源域类别样本的权值高,而属于异常类的权值低。

 

 

实验结果

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值