CVPR 2021 paper
目录
1.摘要
广义零样本学习(GZSL)的目标是当只提供可见类的已标记示例来识别可见类和不可见类的对象。
生成模型可以合成不可见的类中缺失的视觉特征,以减轻GZSL中的数据不平衡问题。然而,由于原始的视觉特征空间缺乏区分信息,对于GZSL分类是次优的。
我们建议将生成模型与嵌入模型集成,从而产生一个混合的GZSL框架。混合GZSL方法将生成模型产生的真实样本和合成样本映射到一个嵌入空间中,在那里我们执行最终的GZSL分类。
具体来说,我们为我们的混合GZSL框架提出了一个对比嵌入(CE)。所提出的对比嵌入不仅可以利用类监督,还可以利用实例监督,而后者通常被现有的GZSL研究所忽视。
2.思想
在语义空间中,我们可以通过直接将嵌入的数据点与给定的类级语义描述符进行比较来进行ZSL分类。语义嵌入方法在传统的ZSL中表现出色,但在更具挑战性的GZSL场景中,它们的性能大幅下降,因为它们在测试阶段严重偏向于可见类。
特征生成方法可以弥补不可见类训练样本的不足。将真实可见的训练特征和合成的不可见特征结合起来,可以训练一个监督模型来实现GZSL分类。然而,特征生成方法在原始特征空间中产生合成的视觉特征会远离语义信息,因此缺乏判别能力,对于GZSL分类来说是次优的。
为了两全其美,在本文中,我们提出了一个混合GZSL框架,将嵌入模型嫁接到特征生成模型之上。在我们的框架中,我们将特征生成模型产生的真实可见特征和合成不可见特征映射到新的嵌入空间。我们在新的嵌入空间中执行G