首先来看一篇比较经典的zero-shot learning相关的paper (http://101.96.10.65/www.cs.cmu.edu/afs/cs/project/theo-73/www/papers/zero-shot-learning.pdf)。
这篇paper是NIPS 2009中的一篇论文,作者来自CMU,Intel及多伦多大学。文章所要处理的问题是针对训练集中缺失标签的样本,如何预测其标签或类别。其思路是对类别标签建立由语义信息构成的知识库,进而可以推测新的类别。
什么是zero-shot learning呢?zero-shot learning即为训练样本中的类别变量有某种程度的缺失。本篇论文之前,学者 Larochelle et al. (2008) 也研究了zero-shot learning,其中可以对训练集中缺失的数字所对应的新类别进行预测。更简洁地来讲,比如你没见过某种动物,但是,你从其他地方得知了对这种动物的描述,见了之后一眼就能做出判断,这就是zero-shot learning。
作者所提模型可以学习输入数据和语义特征之间的关系。可以利用所学关系通过两个阶段对新输入的数据预测其类别。给定新的输入数据&#