论文阅读-Prototype Rectification for Few-Shot Learning

最新推荐文章于 2023-07-10 23:44:01 发布

wangs1996

最新推荐文章于 2023-07-10 23:44:01 发布

阅读量2k

点赞数

分类专栏：小样本学习文章标签：深度学习人工智能小样本学习原型网络 ECCV2020

本文链接：https://blog.csdn.net/wangs1996/article/details/107530001

版权

本文探讨了小样本学习中原型网络的偏差问题，提出了CSPN（余弦相似度基元网络）和偏置减小模块（BD），以减少类内和类间偏差。通过使用伪标签策略和加权平均来改进原型计算，同时在inference阶段通过调整query样本消除交叉类偏差。实验表明，这种方法有效地提高了小样本学习的准确性。

摘要由CSDN通过智能技术生成

ECCV 2020 Oral

源码暂未开放

传统的原型网络是将support集里面每个类的所有样本的特征的平均作为该类的原型representation，通过query集合的特征representation与support集中每个类别的原型representation进行欧式距离计算，在经过softmax得出最后所属类别。

作者认为简单的求平均会产生很大的bias，因此提出了对原型网络进行修正。从两个角度：intra-class bias和cross-class bias

基于余弦分类器使用base类训练一个特征提取器 $F_\theta(·)$ 以及余弦分类器 $C (\cdot ∣ W)$

$C\left(F_{\theta}(x) \mid W\right)=\operatorname{Softmax}\left(\tau \cdot \operatorname{Cos}\left(F_{\theta}(x), W\right)\right)$
$W$ 是可学习的权重， $\tau$ 是一个标量参数
损失函数： $L(\theta, W \mid \mathcal{D})=\mathbb{E}\left[-\log C\left(F_{\theta}(x) \mid W\right)\right]$