论文阅读笔记《Adversarial Feature Hallucination Networks for Few-Shot Learning》

最新推荐文章于 2024-08-24 10:17:44 发布

深视

最新推荐文章于 2024-08-24 10:17:44 发布

阅读量3k

点赞数 3

分类专栏：论文阅读笔记 # 小样本学习文章标签：深度学习小样本学习数据增强对抗生成网络

本文链接：https://blog.csdn.net/qq_36104364/article/details/107015984

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章 145 订阅

订阅专栏

小样本学习

100 篇文章 136 订阅

订阅专栏

小样本学习&元学习经典论文整理||持续更新

核心思想

本文提出一种基于数据增强的小样本学习算法（AFHN），利用生成对抗网络（GAN）实现数据集的扩充。数据增强的方法被认为可以增强类内样本方差的多样化，从而实现更加清晰地分类界限。先前的数据增强方法主要包含两类：一类是通过在基础数据集上学习一种变换映射，并将其直接应用到新的数据集上，得到映射后的合成图像用于数据扩充，这一类方法会破坏合成图像的区分能力（因为合成图像很粗糙，与原始类别并不相似）；另一类方法是根据特定的任务生成对应的合成图像，这类方法保证了合成图像的区分能力，但特定的任务约束使得合成的图像容易陷入一种特定的模式，从而丧失了多样性（在GAN中这种情况称之为Mode Collapse，就是指生成的图像之间太过于相似，不具备多样性）。本文利用conditional Wasserstein Gener- ative Adversarial Networks ，cWGAN（与普通的GAN相比，cWGAN就是通过改进目标函数，进而提高训练稳定性的一个变种，此处不再详细介绍）生成样本，并通过增加分类正则项（classification regularizer）和 “反陷入”正则项（anti-collapse regularizer），解决了生成样本缺少区分能力和多样性的问题。本文提出算法的处理流程如下图
在这里插入图片描述
首先支持集图像和查询集图像经过特征提取网络 $F$ 得到对应的特征向量，支持集对应的特征向量为 $s$ （如果有多个样本则取平均值），从[0,1]的均匀分布中采样得到两个随机变量 $z_1,z_2$ 。然后将特征向量 $s$ 和 $z_1,z_2$ 输入到cWGAN的生成器 $G$ 中，得到合成的向量 $\tilde{s}_1,\tilde{s}_2$ ，过程如下
在这里插入图片描述
将生成的 $\tilde{s}_1,\tilde{s}_2$ 与原始的 $s$ 和 $z_1,z_2$ 输入到区分器 $D$ 中，并计算GAN损失 ${L}_{GAN}$ ，过程如下

而单纯的GAN损失并不能解决生成样本缺少区分能力和多样性的问题，因此本文又设计了两个正则化项：分类正则项（classification regularizer）和 “反陷入”正则项（anti-collapse regularizer）。其中分类正则项很好理解，首先利用softmax函数根据生成的样本 $\tilde{s}$ 得到查询样本 $x_q$ 对应类别的概率，计算过程如下
在这里插入图片描述
式中 $q=F(x_q)$ ，然后再利用交叉熵损失函数计算分类损失，作为分类正则项 $L_{cr_i}$ ，该正则项的目的是为了增强生成样本的区分能力

而“反陷入”正则项则是直接对两个合成特征向量的不相似度和产生它们的两个噪声向量的不相似度的比值进行惩罚，文字表述比较复杂，我们直接看公式
在这里插入图片描述
式中，分子部分表示了两个合成特征向量之间的不相似度，而分母表示两个噪声向量之间的不相似度。有研究表明 $z_1$ 和 $z_2$ 越相似，则 $\tilde{s}_1$ 和 $\tilde{s}_2$ 越容易陷入同一种模式。当 $z_1$ 和 $z_2$ 很相似时，也就是分母很小时，上式则相当于放大了 $\tilde{s}_1$ 和 $\tilde{s}_2$ 之间的不相似度（因为要除以一个远小于1的数字）。该正则项的目的时为了增强生成样本的多样性。
最后，将生成的样本 $\tilde{s}$ 与原始样本 $s$ 一起输入到分类器 $C$ 中，进而实现对于查询样本 $x_q$ 的分类。