【最优传输论文十六】(2022 AAAI)Hierarchical Optimal Transport for Unsupervised Domain Adaptation

大多数最优传输方法的共同点是它们能够通过依赖反映输入空间度量的成本函数来捕获数据的底层几何结构。然而,这些最优传输方法可以受益于不依赖于这些基本的几何信息,因为还有其他重要的结构信息没有直接从地面度量中获取,例如,由源中的类标签引起的局部一致性结构。一些方法在域自适应中的应用仅考虑了标记源域中的可用结构,通过按类标签对样本进行划分,而每个目标样本形成自己的聚类。然而,将这些目标结构直接纳入最优传输公式可以显著改善领域自适应算法的性能。
摘要由CSDN通过智能技术生成

1. motivation

大多数最优传输方法的共同点是它们能够通过依赖反映输入空间度量的成本函数来捕获数据的底层几何结构。然而,这些最优传输方法可以受益于不依赖于这些基本的几何信息,例如,由源中的类标签引起的局部一致性结构。然而一些方法在域自适应中的应用仅考虑了标记源域中的可用结构,通过按类标签对样本进行划分,而每个目标样本形成自己的聚类。

在本文中,作者通过提出一种基于分层最优传输的全新方法来解决上述目标结构不可知算法的现有局限性。所提出的方法HOT-DA是基于最优运输的分层公式,它利用了地面度量捕获的几何信息之外的更丰富的源和目标域的结构信息。标记源域中的附加信息是通过根据样本的类标签将样本分组到结构中来本能地形成的。而在未标记的目标域中探索隐藏结构则被简化为通过Wasserstein质心学习概率测度的问题,我们证明了它等价于谱聚类。

图1说明了这种范式与领域适应的相关性,其中我们表明,结构不可知的reg - ot和目标结构不可知的OT-GL算法不能总是限制不同结构实例之间的质量传输,而我们的领域适应的分层最优传输(HOT-DA)模型通过同时利用源和目标领域结构来正确地做到这一点。

无监督域自适应算法的目的是推断出具有低目标风险的分类器η: X→Y:

2. Optimal Transport 

找到一个可测量的传输映射T:X→Y将由概率测度µ表示的质量运输到ν表示的质量,同时使运输的总成本最小化:

这个宽松的公式,被称为蒙日-坎托洛维奇问题(MK),允许质量分裂,与蒙日的公式相反,它保证了在非常一般的假设下解的存在:

当X = Y是距离为d的度量空间时,自然的选择是将其作为代价函数,问题(MK)在X上的概率测度之间引入一个度量,称为P - wasserstein距离,定义如下:∀µ,ν∈P(X): 

在最优输运的离散版本中,最优运输问题变成一个线性规划,因此,求解这个线性规划就是找到一个计划γ *,它实现:

 p-Wasserstein距离定义为:W_{p}^{p}(u,v)=<\gamma ^{\ast },C>_{F}

相对而言,N个测度{ν1,…vn}的Wasserstein重心在P(X)中可以定义为以下函数f 的最小值:

其中λi是正实数使得\sum _{i=1}^{N}\lambda _{i}=1。 

如上所述,离散最优运输是一个线性规划,因此可以用单纯形算法或内点法在O(r3log(r))内精确求解,其中r = max(n, m),这是一个沉重的计算代价。熵正则化已经成为解决最优运输计算负担的一种方法。熵正则离散最优运输问题定义如下:

其中H(\gamma )=-\sum _{i=1}^{n}\sum _{j=1}^{m}\gamma _{ij}(log(\gamma _{ij})-1)是γ的熵。

分层最优传输将结构信息直接引入传输过程。设X是具有距离d的波兰度量空间,根据公式(3)P(X)是X上具有Wasserstein距离Wp的Borel概率测度空间。由于X是波兰度量空间,则P(X)也是波兰度量空间。

通过概念的递归,P(P(\chi ))上的Borel概率测度的空间是一个波兰度量空间,并且还将配备一个Wasserstein度量W_{p}^{'},这次由Wasserstein距离Wp引起,它充当P(X)上的基础度量。更正式地说,令\theta =(\mu _{1},...,\mu _{h}),且\vartheta =(v_{1},...,v_{l})是P(X)上的两组概率测度,即

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值