Optimal Transport for knowledge distillation

OT 的应用场景往往是样本是在Euclidean上,而限制了其在structural data(graph, trees, time series)上的应用,或者跨space上的应用,这些统称为incomparable space情况。

Wassertein distance作为比较概率分布的有用工具,得益于两点:1.它是距离;2. weak convergence of the probability measure.那么可以用样本的pm代替真实的pm.

21-UAI-MOST Multi-Source Domain Adaptation via Optimal Transport for Student-Teacher Learning

摘要:
Multi-Source DA比传统的DA更具有挑战性,因为知识要从几个源于转移到目标域。为此,我们在本文中提出了一个使用OT和模仿学习理论的Multi-Source DA新模型。更具体地说,我们的方法由两个合作代理组成:一个teacher分类器,一个student分类器。teacher分类器是一个 综合的专家,它利用理论上可以保证的领域专家的知识来完美地处理源实例,而student分类器在目标领域中试图模仿teacher分类器在源领域中的行为。我们基于OT开发的严格理论使这种跨域模仿成为可能,同时也有助于缓解data shift和label shift。
介绍:
teacher是在labeled的源样本下完美学习的domain experts的组合,student目标是通过模仿teacher的预测来对unlabeled目标样本进行预测。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值