Prototypical Networks for Few-shot Learning 论文笔记

最新推荐文章于 2023-10-14 15:41:37 发布

头柱碳只狼

最新推荐文章于 2023-10-14 15:41:37 发布

阅读量853

点赞数 1

分类专栏：小样本学习

本文链接：https://blog.csdn.net/qq_30146937/article/details/104928327

版权

本文深入探讨了原型网络在few-shot learning中的作用，通过将样本映射到embedding空间，以类均值作为原型进行分类。与Matching Networks相比，原型网络更简洁，效果相当。此外，讨论了距离度量、episode设置等设计思路，以及原型网络在zero-shot learning中的适应性变化。

摘要由CSDN通过智能技术生成

前言

本文提出了用于few-shot learning的原型网络（prototypical network），它的基本思想是，在一个embedding空间中，每个类都有一个原型表示（prototypical representation），每个类的点都聚集在这个原型表示周围。具体来说就是，通过一个非线性映射将输入映射到一个embedding空间中，提取每个类别中样本的均值（mean）作为该类在embedding空间中的原型（prototype），那么对于一个embedded point来说，分类就是找到离它最近的类原型。使用属于Bregman divergence的欧几里得距离作为度量距离，在训练时，让测试样本到自己所属的类的原型的距离越近越好，到其它的类原型越远越好；测试时，对测试样本到各个类原型的距离做softmax，预测测试样本的类别标签。

原型网络

在few-shot分类中，给定一个支持集 $S$ ，其中有 $N$ 个带标签的样本，即 $S=\lbrace(x_1,y_1),...,(x_N,y_N) \rbrace$ ，每个 $x_i \in \Bbb R^D$ 是一个样本的 $D$ 维的特征向量， $y_i \in \lbrace 1,...,K \rbrace$ 是其对应的类别标签， $S_k$ 表示类别为 $k$ 的支持集。