原型网络 Prototypical Network

最新推荐文章于 2024-10-03 13:38:53 发布

ywm_up

最新推荐文章于 2024-10-03 13:38:53 发布

阅读量5.6k

点赞数 5

分类专栏：论文笔记文章标签：小样本学习原型网络

本文链接：https://blog.csdn.net/qq_41357569/article/details/122000849

版权

16 篇文章

订阅专栏

原型网络是一种用于少样本学习的方法，通过计算样本类别的中心来进行分类。它克服了孪生网络需要对比目标与每个样本的缺点，转而计算目标与每个类别的中心距离。此方法简化了分类过程，并提高了效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

请添加图片描述

原理和聚类有点相似

孪生网络的缺点就是要对比目标和过去每个样本之间的相似度，从而分析目标的类别，而原型网络就提出，把样本投影到一个空间，计算每个样本类别的中心，在分类的时候，通过对比目标到每个中心的距离，从而分析出目标的类别。

核心思想：在N-way K-shot设置下，通过计算 support set 中的嵌入中心，然后衡量新样本与这些中心的距离来完成分类。

support set：包含少量标注的样本
query set：包含未标注样本，和support set的样本空间一致，不能和 support set 有重复
计算嵌入中心公式，简单的取平均
- $S_k$ ：类别为 k 的 support set
- $f_θ$ ：embedding 函数
- $x_i$ ：输入
  $c_k = \frac{1}{|S_k|} \sum_i f_θ(x_i)$
计算新样本 x 到每个类别 i 的嵌入中心的距离： $d_i = d(f_θ(x), c_i), i = 1,...,N$ ，然后再用softmax对距离做映射，得到每个类别的概率 $\hat y_i = softmax(d_1,...,d_k)$ 。
训练目标通过SGD优化交叉熵损失函数：
- $y$ ：真实值
- $\hat y$ ：预测值
  $\hat y) = - \sum^{N'}_{i = 1}y_i log\hat y_i$