1.Motivation
现有的大多数基于最优传输的工作忽略了域内结构,只实现了粗略的成对匹配。分布在聚类边缘附近或远离其对应类中心的目标样本很容易被从源域学习的决策边界错误分类。在本文中,提出了用于无监督领域自适应的可靠加权最优传输(RWOT),包括新的收缩子空间可靠性(SSR)和加权最优传输策略。具体而言,SSR利用空间原型信息和域内结构来动态测量跨域的样本级域差异。此外,利用基于SSR的加权最优传输策略来实现精确的成对最优传输过程,减少了目标域中决策边界附近样本带来的负迁移。RWOT还配备了判别质心聚类策略来学习迁移特征。
2.可靠加权最优运输
2.1. 收缩子空间可靠性(SSR)
聚类的边缘或远离其对应的类中心的超平面很容易被从源域学习的超平面错误分类。受领域自适应的自标记的启发,利用从标记的源数据中学习到的每个类的空间原型,为目标样本分配一个“伪”标签。考虑到目标样本分布在聚类边缘附近引起的负迁移,本文提出了收缩子空间可靠性(SSR)来测量跨域的样本级域差异,包括空间原型信息来归一化原型距离和域内结构计算目标样本i属于k类的概率。
为了量化两个域中的空间原型信息,将定义为源域中深层特征的类中心,并且,其中C表示Ds中的类的数量。d是瓶颈层中输出神经元的数量。空间原型信息由矩阵D∈Rn×C定义为:
其中d(Gf(xti),csk))是目标样本Gf(xti)和第k个源类中心csk之间的距离,其中k∈{1,2,…,C}。n表示用于训练的批量大小。与单调测量两个领域差异的单核方法相比,本文专注于多核来全面增强特征表示的可转移性,用于深度领域自适应。因此,d的多核公式(Gf(xti),csk)可以定义为:
与特征映射相关联的特征核,核,定义为m个PSD核{Ku}的凸组合: