论文阅读笔记《Self-attention relation network for few-shot learning》

最新推荐文章于 2022-07-18 16:34:16 发布

深视

最新推荐文章于 2022-07-18 16:34:16 发布

阅读量2.3k

点赞数 2

分类专栏：论文阅读笔记 # 小样本学习文章标签：深度学习小样本学习度量学习

本文链接：https://blog.csdn.net/qq_36104364/article/details/108661046

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章 142 订阅

订阅专栏

小样本学习

100 篇文章 136 订阅

订阅专栏

小样本学习&元学习经典论文整理||持续更新

核心思想

本文提出一种基于度量学习的小样本学习算法（SARN），其在Relation Network的基础上增加了自注意力机制，使网络能够提取到非局部的远距离的依赖信息。这是什么意思呢？就是普通的卷积神经网络只能提取到局部区域（感受野）内的依赖关系，而自注意力机制则是希望寻找到每个像素点与其他所有像素点之间的依赖关系，或者叫做相关性。这样做的原因是，支持集图像和查询集图像中统一特征的物体其空间位置可能并不相同，比如两幅狗的照片，一张图片中狗的尾巴在图像的右上角，另一幅图片中狗的尾巴在图像的左下角，如果只是简单的将两幅图像的特征图级联，并进行卷积的话，是无法寻找到右上角和左下角两个尾巴特征之间的关系的。自注意力机制就是为了解决这个问题，本文提出的网络结构如下图所示
在这里插入图片描述
整个网络由特征提取模块、自注意力模块和相关性模块构成，特征提取网络和相关性模块不再详述。自注意力模块首先把支持集图像的特征图和查询集图像的特征图级联起来，得到特征图 $p\in\mathbb{R}^{C\times H\times W}$ ，对于位置 $i$ 处，自注意力模块的输出 $o_i$ 如下
在这里插入图片描述
其中 $p_i$ 就是输入特征图位置 $i$ 处对应的特征值， $A$ 和 $B$ 都是输入特征图 $p$ 经过1 * 1卷积得到的（两个卷积核不共享），并将特征图铺平， $A，B\in \mathbb{R}^{C\times N}$ ， $\times W$ ； $h(A_i,B_j)$ 就是用于计算位置 $i$ 和位置 $j$ 之间关系的过程，本文采用带有softmax的高斯函数
在这里插入图片描述
另一个函数 $t(p_j)$ 用于计算输入特征图 $p$ 在位置 $j$ 处的表征，同样是一个1 * 1的卷积，并将结果铺平。 $\mathcal{N}$ 表示归一化因子，计算过程如下

上述过程重复执行两次，得到带有自注意力图的特征图 $o$ ，再经过两个全连接层输出查询集图像和支持集图像之间的相似性得分。