Domain Adaptation:缺少有监督数据场景下的迁移学习利器

你好呀,如果觉得我的算法分享对比有帮助,欢迎关注我的微信公众号“圆圆的算法笔记”,更多算法笔记和世间万物的学习记录~或者点击链接关注哟:Domain Adaptation:缺少有监督数据场景下的迁移学习利器

1. Domain Adaptation介绍

说起Domain Adaptation,首先要从迁移学习说起。迁移学习主要解决的是将一些任务(source domain)上学到的知识迁移到另一些任务(target domain)上,以提升目标任务上的效果。当目标任务有较充足的带标签样本时,迁移学习有多种实现方法。例如,采用Pretrain-Finetune的方式,先在源任务上Pretrain,再在目标任务上用一定量的数据Finetune;或者利用Multi-task Learning的方式,多个任务联合训练。然而,当目标任务没有带标签的数据,或者只有非常少量的带标签样本时,上述两种方法就无法采用了。因此,Domain Adaptation应蕴而生,主要解决目标任务没有数据或数据量非常少无法训练模型的场景

Domain Adaptation的基础模型结构主要分为feature extractor和classifier两个部分。其中,feature extractor用来从source domain样本或target domain样本上提取特征表示,classifier用于根据feature extractor提取的特征进行具体的分类任务。Domain Adaptation的核心思路为,让feature extractor部分生成的source domain或target domain的特征表示是同分布的,即将source domain和target domain的特征表示对齐。这样后续的classifier就可以使用source domain数据上训练好的模型预测target domain的数据了,无需再用target domain有标签样本进行finetune,解决了target domain无有标签数据的迁移学习问题。

本文介绍了Domain Adaptation的基本原理和近几年来的顶会论文,带大家快速了解Domain Adaptation的SOTA方法。

2. Domain Adaptation基本方法介绍

正如上文所说,Domain Adaptation的核心思路是训练一个feature extractor,让其生成的source Domain和target Domain的特征分布一致。为什么让source Domain和target Domain的特征分布一致时Domain Adaptation效果最优,是在Analysis of representations for domain adaptation(NIPS 2017)中有理论支持的,两个domain分布差异是target domain预测误差的下界。业内主要有两类解决思路,分别是基于分布距离度量约束的方法和基于对抗学习的方法。

  • 基于分布距离度量约束的方法:通
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值