人类通过看少数样例甚至是一个样例后,就可以学会识别从未见过的新类别,当然我们希望机器也可以具备这样的能力,所以近些年few-shot learning得到了广泛的关注,它的目标可以概括为构建一个可以从少量标记数据中进行归纳的模型。这里我们举个例子来描述小样本算法中的一个经典任务。在5-way 5-shot任务中,我们有25张图片做为support set,其中包含5张猫类照片,5张狗类张片,5张人类照片,5张汽车照片,5张房子照片,随后将几张没有标签的人类照片作为query set,我们的目标为给模型25张带有标签的图片后,让模型为query set中的图片做预测,预测其中的图片是属于5类中的哪一类。Support set中的五类图片可以是训练集出现过的,也可以上训练集中从未出现过的类别。解决这类问题已有的方法可以分为三类:(1)meta-learning方法,包括Matching Network,Relation Netowork,Prototypical Network,MAML等。(2)最大化来自不同类的示例之间的距离。(3)对不同类别的先验分布使用贝叶斯建模。
本次分享的这篇论文是Boris N. Oreshkin等人发表在NeurIPS 2018上的文章,这个工作使用metric scaling方法来改变小样本算法的参数更新方式,在Mini-ImageNet 5-way 5-shot任务中准确率提升了14%。此外,作者提出了一种简单高效的方式来提取任务表示,构建了更加meta的神经网络来完成小样本图像分类任务。实验结果表明该网络结构性能达到了当前最优。
这篇文