【最优传输论文笔记三】Domain Adaptation with Regularized Optimal Transport(2014 ECML)

摘要

首个使用最优传输来解决领域自适应问题,通过在源域和目标域的概率分布函数之间搜索最佳运输计划,可以估计学习样本的非线性和可逆变换。任何标准的机器学习方法都可以应用于转换集,这使得本文的方法非常通用。本文提出了一种新的优化传输算法,该算法在优化中引入了标签信息:这是通过将有效的矩阵缩放技术与非凸正则化项的优化相结合来实现的。

本文为源域中的每个样本定义了一个本地运输计划,从这个意义上说,域自适应问题可以被视为要传输的所有样本的图匹配问题,其中通过将源样本映射到与目标域的边缘分布匹配的坐标来找到它们的最终坐标。

一、Optimal Transportation

1.1The Monge-Kantorovitch Problem and Wasserstein Space

T#u在\Omega _{2}上的概率测度:

u_{s}=P(\Omega _{1})u_{t}=P(\Omega _{2})是两个域的两个概率测度。如果T#u_{s}=u_{t},则称T为传输。与此相关的成本 :

密度函数:dμ(x)=f(x)dx

其中成本函数c:Ω1×Ω2→ R+可以理解为正则距离函数,但也可以理解为将质量μ(x)从x移动到y所需的能量。现在可以将最佳传输T0定义为以下最小化问题的解:

将 Ω1中的x运输到Ω2的T(x)的最小成本的解,即Monge传输问题。

最优输运的等价Kantorovitch公式寻求Ω1和Ω2之间的概率耦合γ∈P(Ω1×Ω2):

其中P^{\Omega _{1}}\Omega _{i}上的投影。在这个公式中,γ可以被理解为具有边缘μs和μt的联合概率测度。γ0是最优运输问题的唯一解。它允许将μs和μt之间的Wasserstein距离(EMD距离)定义为: 

sup上确界:一个集合最小的上界;inf下确界:一个集合最大的下界

1.2 Optimal Transport of Discrete Distributions

最优传输的离散分布

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Domain adaptation with auxiliary task是一种在领域适应中使用辅助任务的方法。领域适应是指将在一个领域上训练的模型应用到另一个领域的问题上。通常情况下,模型在不同领域之间的性能会下降,这是因为两个领域之间的数据分布差异。 辅助任务是指在领域适应过程中引入一个与目标任务相关但在源领域上已有标注的任务。这个辅助任务可以帮助模型学习到源领域和目标领域之间的共享特征和知识。通过将源领域和目标领域的数据同时输入到模型中进行训练,模型可以学习到源领域和目标领域之间的联系。 使用辅助任务的方法有两种:joint training和pretraining。在joint training中,源领域的数据和目标领域的数据通过一个共享的网络结构进行训练,源领域的任务和目标领域的任务可以同时进行。在pretraining中,首先使用源领域的数据训练一个模型,然后将这个已经训练好的模型作为初始模型,再使用目标领域的数据进行微调。 辅助任务的引入可以带来多个优势。首先,通过在源领域上引入额外的训练数据,可以提高模型在源领域上的性能。其次,通过学习到源领域和目标领域之间的共享特征,模型可以更好地适应目标领域的数据,从而提高在目标领域上的泛化能力。最后,辅助任务可以帮助模型避免因迁移而导致的信息丢失和过拟合问题。 综上所述,domain adaptation with auxiliary task是一种通过引入辅助任务来加强领域适应的方法。通过辅助任务的学习,模型可以从源领域和目标领域的数据中获得更多的共享知识和特征,从而提高在目标领域上的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值