摘要
在广义零样本学习中,许多方法依赖于图像特征空间和类别嵌入空间之间的跨模态映射。由于标记图像成本高昂,一种方法是通过生成图像或图像特征来扩充数据集。然而,前者会丢失细粒度细节,而后者则需要学习与类别嵌入相关联的映射。在这项工作中,我们将特征生成推进了一步,提出了一种模型,通过模态特定的对齐变分自动编码器学习图像特征和类别嵌入的共享潜在空间。这使我们在潜在特征中获得了关于图像和类别的必要的判别信息,我们在这些特征上训练了一个softmax分类器。我们方法的关键在于我们将从图像和侧信息学习的分布进行了对齐,以构建包含与未见类别相关的基本多模态信息的潜在特征。我们在几个基准数据集上评估了我们学习到的潜在特征,即CUB、SUN、AWA1和AWA2,并在广义零样本学习以及少样本学习方面建立了新的最先进水平。此外,我们在ImageNet上使用各种零样本分割方法展示了我们的潜在特征在大规模设置下的泛化能力。