本次介绍的论文:
2018 - ICLR - 《Meta-Learning for Semi-Supervised Few-ShotClassification》
在上篇博客中介绍了原型网络,一种基于度量的小样本分类方法,核心思想便是在一个嵌入空间中将所有同类的样本拉到较近的位置,然后通过距离度量的方式来判断一个样本x属于哪一个类。对于原型网络,这是一个监督学习,即训练数据全都是有标签的数据。在实际生活中,一般我们需要解决的小样本分类问题应该是半监督的,因为在很多领域,例如医疗、航天等,会有很多没有标注过的信息,这些信息中部分是有用的,但是如果全都进行人工标注,是很费时费力的。所以,实际的小样本分类问题应该是只有少量已标注好的样本和很多未标注的样本,这些未标注的样本中有和已标注样本同类别的,也有不同类别的。本篇所讲的论文便是解决这样的问题,也就是半监督的小样本学习,在原型网络的基础上做的三种扩展。
首先先简单回顾一下原型网络,原型:
这个原型的公式与上篇博客所讲的公式意义一样,都是求类c中所有样本特征的平均值。然后对于一个样本x,其属于类c的概率: