论文阅读笔记《RelationNet2: Deep Comparison Columns for Few-Shot Learning》

最新推荐文章于 2023-12-09 09:21:20 发布

深视

最新推荐文章于 2023-12-09 09:21:20 发布

阅读量2.8k

点赞数 3

分类专栏：论文阅读笔记 # 小样本学习文章标签：深度学习小样本学习度量学习

本文链接：https://blog.csdn.net/qq_36104364/article/details/109026610

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章 141 订阅

订阅专栏

小样本学习

100 篇文章 136 订阅

订阅专栏

小样本学习&元学习经典论文整理||持续更新

核心思想

本文提出一种基于度量学习的小样本学习算法（DCN），从论文的题目能够看出本文是基于RelationNet进行改进的，但与RelationNet相比本文有许多新的改进。首先在网络基础结构上本文是引入了SENet网络，取代了Conv-4的结构；其次与RN只对特征提取网络最后输出的特征图进行相关性计算不同，本文对特征提取网络中间阶段的输出结果都进行了相关性计算；最后与常规特征提取网络直接输出特征图的方式不同，本文输出的是特征图的均值和方差，然后再通过一种重参数化（Reparameterization）的技巧，重构得到特征图，起到一种数据增强（data augmentation）的效果，提高了算法的泛化能力。本文的网络结构如下图所示
在这里插入图片描述
首先，可以看到特征提取网络是分成了四个EM模块，每个模块都是由SENet结构构成的，每个模块都会输出 $f_{\theta,\mu}^{v}$ 和 $f_{\theta,\sigma}^{v}$ 两个部分，分别表示特征图的均值和方差，然后通过重参数化的形式得到重构后的特征图，重参数化过程如下
在这里插入图片描述
其中 $\varepsilon$ 是从高斯分布中随机采样得到的，这样使得每个模块每次重构时得到的特征图 $f_{\theta}^v$ 都带有随机性，这就能够起到数据增强的效果。特别要注意的是，这里提到的 $f_{\theta,\mu}^{v}$ 和 $f_{\theta,\sigma}^{v}$ 并不是真的对特征图计算均值和方差，而是把特征图分割成两个部分，分别表示均值和方差。举个例子，比如第一个EM模块输出通道数原本是64，而本文则是输出65个通道的特征图，前 $64$ 个通道表示特征图均值，最后一个通道表示特征图方差，也就是说对所有通道而言其方差是相同的，然后再进行重参数化计算得到64个通道的重构特征图。
得到的重构特征图一方面要进入下一个特征提取模块EM进行特征提取，另一方面要进入相关性计算模块RM来计算查询样本和支持样本的相关性。对应特征提取网络中的四个模块，RM也包含四个模块，用于相似性的计算。RM模块的输入包括查询样本和支持样本的特征图，还包括上一个RM输出的计算结果 $g_{\phi}^{v-1}$
在这里插入图片描述
最后RM模块的输出 $g_{\phi}^{v}$ 进过全局平均池化和全连接层处理得到相关性得分 $r^v_{ij}$