摘要:
从激活值中预测参数来适应预先训练的神经网络,以适应新的类别。适应新类别不需要训练,通过单次向前传递实现快速推理。
介绍:
问题:针对小样本学习,有参数和非参数两种方法。由于Dfew和Dlarge数据集之间不平衡,参数模型不能很好的训练样本。另一方面,许多非参数方法,如最近邻方法,可以很容易地适应新的概念,而不会严重忘记原来的类。但是距离度量的设计比较困难。
作者认为,一个好的小样本学习的算法需要满足以下三点需求:
(1)在Cfew上实现了合理的性能。
(2)适应Cfew不会显著降低Clarge上的性能(如果有的话)。
(3)推理速度快,适用于小样本分类或zero shot,即有效的终身学习系统
本文:
- 在Dlarge上预先训练好一个深度神经网络。
- 分类层(全连接层及softmax如图所示)本文基于神经网络中同一类别倒数层的激活值和最后的全连接softmax层的参数有密切的关系,通过训练一个参数预测器,使得在大量数据集中预训练过的网络可以通过直接从激活值预测参数的方式将模型映射到只有少量样本的测试数据集中。
- X为输入的图像,经过神经网络得到特征向量a(x)激活值.。Wy为全连接层的一组权重,参数。a(x)×Wy越大,放入softmax中得到的概率便会越大。一般情况下,Wy是通过不断的学习,梯度下降,更新之后得到的权重。而这里,将直接使用a(x)去预测Wy。为了满足第二点要求,作者计算出了AyAy = {a(x)|x ∈ Dlarge ∪ Dfew, Y (x) = y}因此,去进行小样本分类,我们希望Ay×Wy越大越好。因为同一类的图像的激活值在空间上聚集,所以,Wy的合理选择与Ay均值对齐。
2.1学习参数预测器
2.2.推理