摘要
本文通过根据手头的目标任务调整源分布的权重来利用源分布的多样性,该方法称为加权联合分布最优传输(WJDOT),旨在同时找到基于最优传输的源分布和目标分布之间的对齐以及源分布的重新加权。
1.介绍
在许多实际应用中,例如当背景、位置、照明或姿势发生变化时,以及在不同说话者或录音条件下的语音识别中,新数据可能会出现分布变化(域移位),从而降低算法的性能。
针对以上问题,本文采用源分布的多样性来寻找与目标分布距离最小的源联合分布的凸组合,在推导出涉及该距离的目标的新泛化界后,提出优化Wasserstein距离,该距离定义在特征/标签积空间上,在目标域和标记源的加权和之间。本文的方法的一个独特之处在于权重是与分类函数同时学习的,这允许基于源与目标的相似性来分配质量,无论是在特征中还是在输出空间中。本文的方法估计了提供域相关性和可解释性度量的权重,并将提出的方法称为加权联合分布最优传输(WJDOT)。
本文相关符号:
S为源域的个数,其中特征和标签都是可用的。假设有一个可微嵌入函数g: X→G,其中g是嵌入空间。本文所有的输入分布都在这个嵌入空间中。设ps为源域s的真实分布,pT为目标域的真实分布,两者都支持积空间G × Y,其中Y为标签空间。源域中经验源分布:。目标域,经验目标边际分布。损失函数L和联合分布p,函数f的期望损失定义为。
2.联合分布最优传输回顾
JDOT使用代理联合经验分布,其中标签被分类器的预测f: G→Y取代,即
并提出以下优化问题: