摘要
深度网络通过对抗训练学习域不变性特征,但域自适应技术在源域和目标域实现类别层级的对齐仍然是有限的。本文提出了SymNets模型在对齐源域和目标域的边缘分布的同时也增强了对两个域中条件分布的对齐,从而实现类别层级的对齐。在领域自适应中源域和目标域上的任务是一致的,为此SymNets设计了一个对称的任务分类器结构,也就是说传统的分类器是有K个神经元对应K个类别,而SymNets为源域和目标域分别设计K个神经元。此外,利用这个对称结构可以构建一个和这两个分类器共享权重的额外分类器(域辨别器)。本文设计了6个loss函数进行模型的训练(这容易导致模型训练难收敛的问题)。在模型的域混淆训练中设计了两个层级的混淆,其中类别级的混淆损失助于特征提取器学习两个领域相对应类别的域不变性特征;域级的混淆损失助于特征提取器学习两个领域整体的域不变性特征。由于目标域无标签,对于目标域的分类器的有监督训练部分,本文提出用源域的有标签数据帮助学习出。
SymNet的架构和目标函数
提出的SymNet的架构,它包括一个特征提取器G和三个分类器、和。分类器与和共享其层神经元。红色和蓝色分别表示目标数据和源数据,以及它们产生的损耗。黄色和绿色分别表示特征提取器和分类器,以及应用于它们的损失。中间的虚线矩形展示了SymNet的特征的玩具示例,这些特征在两个域的相应类别上是不变的。
在SymNets网络中,分类器C有两个并行的任务分类器和,它们都拥有K个神经元对应类别数,此外,本文还设计了一个与和共享神经元的分类器,它拥有2K个神经元。(PS:其实就是一个拥有2K个神经元的分类器模型同时干了三件事情)。注意这里,在本文设计的网络中没有一个明确的域辨别器,域辨别和域混淆是通过对分类器Cst设计损失函数实现的,下面我们先讲解一下怎么训练和分类器。
源任务分类器和目标任务分类器的对称设计
1)首先,对于,就是利用源域数据做有监督分类的交叉熵损失:
2)由于目标样本是未标记的,因此不存在用于学习任务分类器的直接监督信号。所以本文借助有标签的源域数据对目标域上的分类器计算交叉熵损失:
利用源域有标签样例训练目标域分类器。形式上看上去和式子(5)没有区别。但是通过
实现与源域分类器的区分。同时,建立了源域目标域分类器之间神经元的对应关系是后续类别级对齐的基础。
3)通过设计一个与源域目标域分类器共享神经元的来区分样例的不同域。对于可以当作域辨别器,为此本文设计域辨别损失进行训练达到域辨别的效果,通过一个双向交叉熵损失来表示: