[论文笔记] Few-Shot Learning with Global Class Representations

最新推荐文章于 2022-11-23 15:28:03 发布

_陈麒_

最新推荐文章于 2022-11-23 15:28:03 发布

阅读量648

点赞数 1

分类专栏：小样本悲惨的读论文生涯文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/qq_40079310/article/details/104933192

版权

悲惨的读论文生涯同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

小样本

2 篇文章 0 订阅

订阅专栏

[论文笔记] Few-Shot Learning with Global Class Representations

0. 写在前面的话

解决的问题
- 由于基类和新类之间存在严重的样本不均衡问题，导致容易过拟合到基类数据
- 训练模型的时候，使用来自novel class的样本。
新颖点
- 在few-shot里面使用类原型。
- 有点聚类的思想
训练数据包括来自novel class的样本。
面临的困难- base classes 与 novel classes 样本数量的不对等
- 数据扩充
- 元学习策略

项目代码以及开源->网址
iccv 2019

1，概况

为了解决few-shot中由于基类和新类之间存在严重的样本不均衡问题，导致容易过拟合到基类数据的问题，作者将新类样本加入至训练集对模型进行训练。此外，作者将类原型的概念引入few-shot，但相比于之前学习阶段性类别表征的方法，本文使用的是全局类别表征直接与所有基类和新类训练样本进行比较，更具可分辨性。

2，具体框架介绍

2.1 Registration Module

输入&输出

输入
- 局部类原型{r_cj, c_j $\in$ C_train}
- all global class representations G = {g_cj, cj $\in$ C_total}
输出
- 一个矩阵，其中每一列向量
  代表 ith visual features 与 G 全局类原型的相似度

具体步骤

在这里插入图片描述
(在我看来，这个作用在于：就是用局部类原型计算和全局类原型之间的相似度，有利于后面选出最合适的全局类原型)

2.2 Sample Synthesis Module

输入&输出

输入
- support集合中对应novel类的visual 特征
输出
- 代表这个类的局部类原型

具体步骤

首先通过随机裁剪、随机翻转和数据幻觉来将每一个novel class的数据扩充至k_t
对于每一个novel class, 从第一步得到的k_t 样本中随机取k_r个，进行如下操作

(这个模块的作用在于生成support集中 novel 类样本的局部类原型)

2.3 整体框架介绍

在这里插入图片描述

首先用每一个类中所有样本的视觉特征的平均值初始化全局类原型G
构造局部类原型{r_cj, c_j $\in$ C_train}
1. 对于base classes，直接取support集合中对应类样本视觉特征的平均值
2. 对于novel classes, 使用Sample Synthesis Module生成
把局部类原型当作输入，通过registration module 认领对应的全局类原型
1. 其中为了可微性(梯度下降优化参数)，采取软优化，认领 $\xi$ _i = V_i G,而非直接argmax_Vi(G)
计算query集合的视觉特征到全局类原型的欧氏距离，最小者对应的类别为最终结果

在这里插入图片描述

3，损失

registration loss L_reg

在这里插入图片描述

CE(.) 代表交叉熵损失

classifacation loss L_fsl

在这里插入图片描述

4，部分实验效果

4.1 标准小样本学习

作者从 miniImageNet 中取 64 类用作 training，16 类用作 validation，20 类用作 testing。待分类的测试图片只从新类中选取。1 shot 表示在训练集中每个新类有 1 个样本，5 shot 表示每个新类有 5 个样本。每次预测需要从 5 个候选类中选择一个作为给定图片的分类。
在这里插入图片描述