分布对齐 目标函数 迁移学习_《迁移学习》领域自适应:利用DIRT-T模型提高性能...

本文探讨了领域自适应中的分布对齐和目标函数优化,提出VADA和DIRT-T模型。VADA通过最小化条件熵避免决策边界穿过高密度区,而DIRT-T进一步优化决策边界,尤其适用于非保守领域自适应。实验证明,这些方法在手写数字体迁移学习上取得了state-of-the-art的性能。
摘要由CSDN通过智能技术生成

8940bd6e7bf47812fd7b68a2841011ef.png

一、动机

领域自适应(domain adaptation)是迁移学习中的一种方法,旨在利用源域中标注好的数据,学习一个精确的模型,运用到无标注或只有少量标注的目标域中。本质上是一种数据增强的方法。

领域自适应最常见的方法是找一个公共特征空间,将源域和目标域数据都映射过去,在该空间进行分布对齐。最近很流行的方法是利用域对抗训练[1],也就是设置一个判别网络,判断特征数据来自于源域还是目标域,特征提取器通过与判别器的对抗实现特征空间的对齐。但是,作者认为域对抗方法有两个关键的限制:

  1. 特征提取函数如果能力太强的话,特征分布对齐就是一个比较弱的约束。
  2. 在非保守的领域自适应(也就是没有一个分类器可以同时在源域和目标域中分类的很好),训练模型在源域上执行的太好会损害在目标域上的性能。

本文考虑一个正交假设(orthogonal assumption)即簇假设(cluster assumption):输入分布包含分离的数据簇,相同label的数据会形成一个簇,不同label的数据会属于不同的簇。这样的话,决策边界就不能穿过数据高密度的区域,因为一旦穿过,就意味着将相同label的数据分成了不同类。

作者提出两个相关模型分别解决以上两个问题:

  1. 虚拟对抗领域自适应模型(VADA),结合领域对抗自适应和一个惩罚项,将决策边界推离数据密度高的地方。
  2. 拥有教师的决策边界迭代细化训练模型(DIRT-T),让分类更专注于目标域。

在保守领域自适应中,VADA就可以工作的很好;在非保守领域自适应中,DIRT-T会帮助VADA工作。

二、模型

领域对抗训练介绍

考虑一个分类函数

,参数是
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值