最近刚刚研究零样本学习相关内容,本次笔记列出来一些零样本学习相关概念,只有理解了这些概念才能更是顺畅的阅读和理解文章。
zero-shot learning
一言以蔽之,zero-shot learning零样本学习就是让学习器对其从来没有见过的类别进行分类。比如:给学习器一堆马和老虎的图片进行训练,训练完毕后,我们输入一张斑马的照片,并希望学习器告诉我们“这是斑马!”。乍一听,这显然是不现实的。
但其实,我们输入的训练数据与希望识别的类别的并不会是完全无关的。显然,我们不会奢求学习器学习一些人脸、飞机等与斑马毫无关联的数据就可以在第一次看到斑马的图片的时候就能够识别出这是一匹斑马。另外,我们还会在零样本学习的过程中利用一些已有的知识,比如“斑马的外形像马,身上有条纹”。像这样,根据现有的马、老虎的照片以及“斑马的外形像马,身上有条纹”这条信息,我们尝试让学习器通过马的数据可以识别出马的外形,通过老虎的数据让学习器可以识别出动物身上的条纹,如果学习器发现一张输入的照片有马的外形+身上有条纹,那么学习器就有足够的信心认为这就是斑马,即使它之前从未见到过斑马的照片。怎么样,是不是刚才无厘头的ZSL任务,现在变得有了一些头。
(会自己搞清楚什么是零样本学习)
基本概念
定义
上面用通俗易懂的语言介绍了ZSL,下面我们给出一些在正式学习之前需要了解的概念。
- 特征空间
输入具体的实例通常用特征向量表示,所有特征向量存在的空间就称为特征空间。 - 可见类& 不可见类
在ZSL问题中,特征空间(feature space)包含一些带标签的训练实例,这些实例所涵盖的的类别就称为可见类(seen classes);同时,特征空间中还包含一些不带标签的测试实例,这些实例所属的类别称为不可见类(unseen classes).
接着我们就可以给出ZSL的具体定义:
带标签测试实例、不带标签测试实例。 - Zero-Shot Learning
对于给定属于可见类集合 S S S,的测试实例 D t r D^{tr} Dtr以及属于不可见类集合 U U U的测试实例 X t e X^{te} Xte零样本学习目标是学习一个分类器
f u ( . ) : X → U f^{u}(.): X \rightarrow U fu(.):X→U 便可以得出预测不可见类的测试实例类别。
语义空间(Semmantic space)
零样本中不可或缺的一部分都是有关类的语义信息,比如上文提到的不可见类斑马的外形象马,身上有条纹“,这些有关类的语音信息构成了语义空间,我们可以将零样本中用到的语义空间根据构造方法分为工程语义空间与学习语义空间。
工程语义空间(Engineered Semantic Spaces)
在工程语义空间中,每个维度的信息都是人工设计的,接下来是零样本经常用到的工程语义空间。
- 属性空间
属性空间是由一组属性构成的语义空间。在属性空间中,描述类的各种属性的术语列表被定义为属性。每个属性通常是短语或词语,如在动物识别任务中,身体颜色(“黄色”“白色”等等),栖息地(“陆地”“海洋”“沙漠”等等)都是属性,属性的集合就构成了属性空间。 - 词汇空间
词汇空间是由一组词汇项数构造的各种语义空间,词汇空间基于可以提供语义信息的类和数据集的标签,数据集可以是一些结构化的词汇数据库,例如:WordNet - 文本关键字空间
文本关键字空间是一种由从每个类的文本描述中提取一组关键字构成。在文本关键字空间中,文本描述的最常见来源是网站,包括维基百科等于一般网站和特定于域的网站。例如:任务是图像中zero-shot flower识别,因此,使用植物数据库和植物百科全书,(其特定于植物)来获得每个花类的文本描述。除了预定义网站之外,还可以从搜索引擎获得这样的文本描述。
此外,还有一些基于特定问题的空间。
基于以上工程语义空间的概念,我们可以发现工程语义空间上的优点是通过语义空间和类原型构建灵活编码人类领域知识,缺点是严重依赖人执行语义空间和类原型工程。
例如:在属性空间中,属性设计需要手工完成,这需要领域专家付出巨大的努力。
学习语义空间(Learned Semantic Spaces)
在学习语义空间中,每个类的原型都是通过学习输出中获得。但是,在这些原型中,每个维都没有明确的含义,而是语义信息包含了整个的原型中。用于提取原型的模型可以进行预先训练。
- 标签嵌入空间
标签嵌入空间是一类通过嵌入类标签来获得类原型的语义空间。可以利用在NLP领域已经得到了广泛的发展和应用的单词嵌入技术。单词嵌入技术中,单词和短语作为向量被嵌入到实数空间中。(单词或短语作为向量被嵌入到实数空间中) - 文本嵌入空间
文本嵌入空间通过嵌入每个类的文本描述来获得类原型的语义空间。与文本关键字空间类似,文本嵌入空间中的语义信息也来自文本描述。不同的是,文本嵌入空间是通过一些学习模型将每个类的文本描述用作模型的输入,输出向量被视为该类的原型。
语义信息来自文本描述。
通过一些学习模型将每个类的文本描述用作模型的输入。 - 图像表示空间
图像表示空间是通过每个类的图像来获得类原型的语义空间。
学习语义空间优势在于需要较少的人工介入,可以照顾到一些很可能被人类忽略的语音信息。不足之处,也很明显,语义空间的每个维度都是隐式的。
学习心得
会自己慢慢的重视零样本阅读,深度耕耘零样本,争取在此方面获得一份顶刊,全部将其搞定都行啦的样子与打算。