论文阅读笔记《Adaptive Subspaces for Few-Shot Learning》

最新推荐文章于 2023-12-05 10:04:10 发布

深视

最新推荐文章于 2023-12-05 10:04:10 发布

阅读量4.3k

点赞数 9

分类专栏：论文阅读笔记 # 小样本学习文章标签：深度学习小样本学习度量学习子空间截断奇异值分解

本文链接：https://blog.csdn.net/qq_36104364/article/details/106984460

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章 141 订阅

订阅专栏

小样本学习

100 篇文章 136 订阅

订阅专栏

小样本学习&元学习经典论文整理||持续更新

核心思想

本文提出一种基于度量学习的小样本分类算法（DSN）。作者引入了子空间的概念，为每种类别都寻找到一个适合的子空间，然后在子空间中进行距离度量，并预测类别。首先作者介绍了几种常见的基于度量学习的小样本分类器，其分类方式如下图所示
在这里插入图片描述
（a）成对的分类器，分别计算查询样本对应的特征向量和每个支持样本对应的特征向量之间的距离，然后按照最近邻的思想预测类别，如Matching Network。
（b）原型分类器，为支持集中每个类别计算出一个原型（每个类别所有样本特征向量的平均值），然后根据查询样本的特征向量与各个类别原型之间的距离预测类别，如Prototypical Network。
（c）非线性二元分类器，利用神经网络学习到一个非线性的距离度量函数，如Relation Network。
（d）子空间分类器，为每个类别计算出一个特征空间的子空间，然后将查询样本的特征向量投射到子空间中，在子空间中进行距离度量，并预测类别，如本文的算法（DSN）。DSN的处理过程如下图所示
在这里插入图片描述
首先，利用特征提取器 $f_{\Theta}$ 将输入图像映射到特征空间中得到对应的特征向量 $f_{\Theta}(x_i)$ ，然后通过平均的方式计算每个类别 $c$ 对应的特征向量均值 $\mu_c$ ，计算过程如下

对于每个类别 $c$ 都可以得到集合 $\tilde{X}_c=[f_{\Theta}(x_{c,1})-\mu_c,...,f_{\Theta}(x_{c,K})-\mu_c]$ ，对 $\tilde{X}_c$ 进行奇异值分解（SVD）得到 $\tilde{X}_c=U\sum V^T$ ，然后选取 $U$ 中前 $n$ 个维度得到截断矩阵 $P_c$ ，由 $\tilde{X}_c$ 得到子空间 $P_c$ 的过程其实就是截断奇异值分解（TSVD）,其与主成分分析PCA非常类似，是一种数据降维的方法。得到每个类别对应的子空间 $P_c$ 后，可以计算查询向量 $f_{\Theta}(q)$ 与每个类别之间的距离 $d (q)$ ，计算过程如下
在这里插入图片描述
式中 $M_c=P_cP_c^T$ ，最后利用softmax函数计算查询样本属于各个类别的概率 $p_{c,q}$ ，计算过程如下

实现过程

网络结构

特征提取网络采用4层卷积神经网络或ResNet网络

损失函数

损失函数包含两项：分类损失和正则化项
在这里插入图片描述
第一项分类损失采用分类概率的负对数，是常见的操作；第二项正则化项目的是最大化各个子空间之间的距离，距离度量方式如下

根据上式可知，为了最大化 $\delta_p^2$ ，就需要最小化 $\left \| P_iP_j^T\right \|_F^2$