参考:
https://www.leiphone.com/news/201810/STIq4kDL6mbIKUmH.html
论文地址:https://arxiv.org/pdf/1711.06167.pdf
问题:映射域迁移 (projection domain shift)
视觉特征称为视觉空间 (visual space)
种类语义信息称为语义空间 (semantic space):种类语义信息包括属性 (attribute) 和词向量 (word vector)
现有的一大类零示例学习的方法是把视觉空间映射到语义空间,或者把语义空间映射到视觉空间,或者把两者映射到共同的子空间。其中学习到的映射称为视觉语义映射 (visual-semantic mapping)。
比如语义空间有一种属性是 has_tail,我们需要学习从视觉空间到该属性的映射,这样给定一张新的动物图片,我们就可以判断它有没有尾巴。在这种情况下,视觉语义映射相当于由若干个属性分类器构成。但是对于不同种类来说,视觉语义映射有很大的差异。比如斑马和猪都有尾巴,但是它们尾巴的视觉呈现差别很大,因而对应的属性分类器差异也很大。如果对于所有种类使用相同的视觉语义映射,在测试种类上得到的效果就会大打折扣。这个问题被称为零示例学习中的映射域迁移 (projection domain shift) 问题。
之前大多数解决映射域迁移的方法都是在训练阶段使用未标注的测试种类数据,为