【论文解读】TapNet: Task-Adaptive Projection for Few-Shot Learning(任务自适应映射网络,小样本)

1. 介绍

论文地址TapNet: Neural Network Augmented with Task-Adaptive Projection for Few-Shot Learning, PMLR 2019.

针对问题: 在机器学习中,仅给出几个训练示例后处理以前看不见的任务仍然是一个艰巨的挑战。

文章贡献

  • 提出一种基于度量学习的小样本学习算法(TapNet,任务自适应映射网络),其特点是网络与每类的参考向量是多任务学习得到的,每个episode,嵌入向量被线性地映射到一个新的空间,作为一种快速任务特定条件反射的形式。训练损失是基于投影空间中查询向量和参考向量之间的距离度量得到的;

  • 在Omniglot、miniImageNet和tieredImageNet数据集上进行测试时,获得了最先进的分类精度。

2. 方法

2.1 模型方法

        TapNet由三个关键元素组成:一个嵌入网络fθ、一组每类参考向量Φ和嵌入特征的任务相关的自适应投影M,负责将嵌入网络fθ映射到参考向量Φ。

        与所有的采用Episode训练方式的算法一样,训练集包含支持集和查询集,与其他的度量学习算法直接计算fθ与到参考向量Φ之间距离的方式不同,本文首先利用一个映射矩阵M,将其投影到一个与任务相关的分类空间中,再度量二者之间的欧氏距离,并利用softmax函数将其转化为分类概率,如下:

        然后利用分类损失对特征提取网络 fθ和参考向量的集合 Φ进行更新,更新后的fθ与Φ用于下一个Episode的训练中。测试时,训练得到的fθ与Φ是固定的,但映射矩阵M 会根据任务进行自适应调整,然后根据距离度量结果进行类别预测。 最后将查询图像与投影空间中的参考文献进行比较,进行最终分类。

        总之,嵌入器fθ和每类参考向量Φ是在不同的任务(事件)中学习的,而投影空间M是针对给定任务构建的,提供了一个快速的任务相关条件。这种结合的结果在一个优秀的能力,以推广到新的数据。

2.2 Construction of Task-Adaptive Projection Space

        寻找映射函数或投影空间M是基于消除嵌入特征和参考之间的不对齐而提出的, 为了处理每个类有多个示例图像的一般情况, 让ck为每个类嵌入特征的平均值,对应于支持集之外的图像。 我们希望找到一个映射器M,使得ck和匹配的参考向量φk在映射空间中高度对齐。 同时,有利于在同一空间内将所有的非匹配权φl与ck很好地分离。

        利用一个简单的不需要训练的线性映射就解决了该问题,首先在考虑到其他类别参考向量的影响后,得到一个修正后的类别 k对应的参考向量 ϕk,计算过程如下:

计算误差向量为:

那么映射矩阵M的目标就是让将映射后的偏差值为0,即嵌入向量与参考向量的映射无限接近,换句话说 M就是偏差 εk​ 的一个线性零解。

式中 D表示 的列数,求解上述问题的一个方法就是计算 εk的奇异值分解(SVD):

式中 Σ是一个对角矩阵,且除了对角线上的前 Nc个值之外其他的值均为0,因此只要取右奇异值矩阵 VT 的从第 N c + 1列到第 N c + D列共 D列向量,其构成的矩阵 M就是所求。并且只要偏差 εk 的长度 L ≥ N c + D ,映射矩阵M就一定存在。

2.3 训练策略

3. Experiment Results

少样本分类:

可视化:投影空间

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值