小样本学习记录————相似性计算经典网络结构(孪生网络、匹配网络、原型网络、关系网络)

最新推荐文章于 2024-05-30 18:07:12 发布

云溪龙

最新推荐文章于 2024-05-30 18:07:12 发布

阅读量9.9k

点赞数 20

分类专栏：小样本学习初探文章标签：网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yunlong_G/article/details/121993470

版权

小样本学习初探专栏收录该内容

7 篇文章 3 订阅

订阅专栏

小样本学习记录————四种相似性计算经典网络结构

小样本学习记录————四种相似性计算经典网络结构

小样本学习记录————四种相似性计算经典网络结构

人类可以通过很少的样本就能学会分辨事务，所以使用较少的样本就可以训练得到一个有不错效果的模型，一直是机器学习特别期待实现的。在读小样本学习文章总会涉及以下几个经典的模型结构，在此进行一一总结。

孪生网络（Siamese network）

孪生网络在2015年被提出使用在one-shot识别中，一般是基于神经网络获得的特征向量，相似度用欧氏距离来度量。网络的结构很简单，如下图所示：通过共享权重的卷积网络（一般网络一致）得到输入图像的特征向量，通过最小化相同类别之间loss，最大化不同类别物体loss进行迭代训练得到一个可以判断两个物体是否相似的网络。

在这里插入图片描述

$\mathcal L = \frac 1 2 lD^2 + \frac 1 2(1-l)\{max(0,m-D)\}^2$

$l$ ：如果 $I_1和I_2$ 相同类别为1，否则为0
$D$ ：表示 $I_1和I_2$ 特征向量的欧式距离
$m$ ：不相似向量之间最小的距离

在小样本学习中，查询集和支持集中图片进行比对得到相似度最高的图片，往往可以得到比较不错的结果。我们可以发现，如果进行多类别识别的问题中，这个比对过程效率比较低下，所以才有了后续的改进模型。

匹配网络（Matching network）

匹配网络在embedding得到特征向量后，通过引入注意力分析两者的相似性。在Matching networks for one shot learning文章中的注意力计算公式。

$a(\hat x,x_i)= \frac {e^{cf(\hat x),g(x_i)} } {\sum_{j=1}^k e^{cf(\hat x),g(x_j)}}$

$\hat x$ 是查询集
$x_i$ 是支持集
c表示计算两者的余弦距离

计算每一个余弦距离再进行softmax

模型最后的输出为是 $\hat y$ 为每一种标签的概率

$P(\hat y|\hat x, S)=\sum_{i=1}^k a(\hat x,x_i)y_i$
在这里插入图片描述

神经网络中的这样的非参数结构使得网络更容易记忆和适应同一任务中的新训练集，但是如果支持集的增多训练的代价就变大了，这是为什么后续又继续改进的原因之一。

如果对注意力机制不是很清楚可以看这篇文章注意力机制的基本思想和实现原理

原型网络（Prototypical Networks）

原型网络提出，先把样本投影到一个空间，计算每个样本类别的中心，在分类的时候，通过对比目标到每个中心的距离，从而分析出目标的类别。

在这里插入图片描述

$c_k=\frac 1 {|S_k|} \sum_{(x_i,t_i)\in S_k }f_\phi(x_i)$

$c_k$ ：表示k类样本的嵌入空间
$S_k$ ：表示标签为k的集合
$f_\phi$ ：表示一种embedding方式

可以理解为其实这就是一个算k类样本中心的函数

对于一个样本可以通过softmax它与每一类的距离，得到最有可能的类，公式如下。

$P(y=k|x)=\frac {exp(-d(f(x),c_k))} {\sum_{k'}exp(-d(f(x), c_{k'}))}$

关系网络（Relation Network）

不论是孪生网络，匹配网络，还是原型网络，在分析两个样本的时候都是通过embedding后的特征向量距离（比如欧氏距离）来反映，而关系网络则是通过构建神经网络来计算两个样本之间的距离从而分析匹配程度，关系网络可以看成提供了一个可学习的非线性分类器用于判断关系，而上述三个网络的距离只是一种线性的关系分类器。

在这里插入图片描述

样本j与类别i之间的关系可以用公式表示为

$r_{i,j}=g_\varphi(C(f_\phi(x_i),f_\phi(x_j)))$

$r_{i,j}$ ：表示样本j与类别i的相关分数
$g_\varphi$ ：表示相关性计算模型
$C$ ：这里的C表示拼接操作，不是计算距离
$f_\phi$ ：表示一种embedding方式

在面对k-shot问题时，将同一类别特征向量按位求和，形成特征图，在进行后续操作。

$\mathcal L = \sum_{i=1}^m\sum_{j=1}^n(r_{i,j}-1(y_i==y_j))^2$

关系网络的创新点就是提出用神经网络，而不是欧氏距离去计算两个特征变量之间的匹配程度。

关注

20
点赞
踩
116

收藏

觉得还不错? 一键收藏
0
评论
小样本学习记录————相似性计算经典网络结构(孪生网络、匹配网络、原型网络、关系网络)

相似性计算经典网络结构(孪生网络、匹配网络、原型网络、关系网络)，介绍每一种网络的结构思想，富含小白的自我理解。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。