文章目录
论文:Matching Networks for One Shot Learning
来源:NIPS2016
地址:https://arxiv.org/abs/1606.04080v2
code:https://github.com/oscarknagg/few-shot
摘要
在这篇文章里我们应用了基于深度神经特征 metric learning 的想法,利用外部的记忆的增强(augment)神经网络。论文中提出的网络对于新的类别数据不需要进行fine-tune。
引言
参数化的模型往往需要大量的样本去训练他们的参数完成样本的吸收,相反,许多非参数化的模型可以快速的吸收样本,但是他们往往依赖于选择的度量,过去的关于 metric learning 的工作影响了我们的模型,我们的目的是整合参数和非参数模型最好的特征。
我们的工作有两个创新点:模型层面和训练层面。模型方面我们提出了 matching nets(MN);第二就是测试和训练的环境必须匹配。
模型
我们的非参数化模型有俩部分,首先,给定(small)支持集 S,模型为每个 S 定义分类器 S → c s ( ⋅ ) S \rightarrow c_s(\cdot) S→cs(⋅),第二我们应用一个专门用于 one-shot learning 的训练策略。
模型架构
我们的贡献是提出了 set-to-set 框架,关键点是当训练时,matching network 能够为 unobserved class 产生合理的测试标签,且不用网络做任何改变。我们希望将一个有着 k 个样本图像-标签对 S = { ( x i , y i ) } i = 1 k S = \{(x_i,y_i)\}_{i=1}^k S={ (xi,yi