Motivations
ZSL问题为了能够泛化到unseen class,通常做了类别辅助信息可用性的假设(辅助信息可以帮助从seen class迁移知识到unseen class)。辅助信息可以是类别属性、词向量等或者是unseen class和每个seen class的相似度。
现有的大多数ZSL方法假设每个类别可以用语义空间中的一个固定点表示,而一个点不足以解释类内方差。而生成模型有很多优势:可以通过特征学习来揭示数据的复杂结构;生成数据的能力可以将ZSL问题扩展为transductive/semi-supervised形式;在seen class的数据很少,而seen/unseen classes的无标记数据很多的情况下,或许也很有用( few-shot learning )。
受此启发,设计了一种深度生成模型来解决ZSL问题。模型学习attribute-specific的潜在空间分布( pψ(z|a),服从高斯分布),作为VAE模型的先验分布,有助于VAE学习判别性更强的特征表示(相当于构造更好的生成器??)。此外,
模型的生成能力使其能够扩展为transductive/semi-supervised形式(通过无监督学习)。模型参数是由seen class的标记数据端到端地学习得到的。(在semi-supervised/transductive也可以用无标记数据)
测试时,对于给定的输入x∗,首先通过VAE的识别模型 qφ (z∗ | x∗) 将x∗映射到隐变量空间z,然后寻找能够使得VAE的下界(对数似然函数变分下界)最大化的a∗ &#