siamese网络_何恺明组新作:重新认识孪生网络在无监督表示学习中的应用

da51c23dbe6035b562d0c376f2439ca4.png

在无监督的视觉表示学习的各种最新模型中,孪生(暹罗)网络已经成为一种常见的结构。

1f44673bc98fed9f562e0a7d0dccb8dd.png

近日,何恺明组发表了名为《Exploring Simple Siamese Representation Learning》的新论文,论文中提到这些模型在避免某些方案崩溃的某些条件下,可以最大化提高了同一图像的两个增强图像之间的相似性。论文报告了令人惊讶的经验结果,即简单孪生罗网络可以学习有意义的表示,即使不使用以下任何一项:(i)负样本对,(ii)大批量,(iii)动量编码器。

实验表明,对于损失和结构确实存在「崩溃解」,但是stop-gradient操作在防止崩溃中起着至关重要的作用。研究人员提供了关于stop-gradient思想的假设,并进一步显示了验证它的概念验证实验。“ SimSiam”方法在ImageNet和下游任务上取得了竞争性结果。作者希望这个简单的基准能够激励人们重新思考暹罗架构在无监督表示学习中的作用。

1、什么是Siamese network 孪生神经网络

Siamese和Chinese有点像。Siam是古时候泰国的称呼,中文译作暹罗。Siamese也就是“暹罗”人或“泰国”人。Siamese在英语中是“孪生”、“连体”的意思。

简单来说,Siamese network就是“连体的神经网络”,神经网络的“连体”是通过共享权值来实现的,如下图所示。

b2cf95ef51f5a2ae0e1a5d4851c6b44e.png

2、结果展示

论文从ImageNet以及迁移学习的角度对比一下所提方法与其他SOTA方法。

2.1 ImageNet

ba3fc2ebd555c5e6722be6e688b1521a.png

作者将与表中ImageNet线性评估的最新框架进行比较。上表显示了SimSiam的batch size为256,既不使用负样本也不使用动量编码器。尽管简单,SimSiam还是取得了竞争性成绩。在100epoch预训练下,它在所有方法中具有最高的准确性,但更长的训练所得收益反而变小。

2.2 迁移学习

48bc9833b059c8477f59eec8e7fa4c57.png

作者通过将它们迁移到其他任务(包括VOC 对象检测和COCO对象检测以及实例分割)来比较表示质量。在目标数据集中端到端微调了预训练的模型。

所有这些方法对于转移学习都是非常成功的。在结果表中,它们在所有任务中都可以超过ImageNet监督的预训练对口,或与之相提并论。尽管存在许多设计差异,但这些方法的常见结构是孪生网络。这种比较表明,连体结构是其总体成功的核心因素。

参考论文:https://arxiv.org/pdf/2011.10566.pdf

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
孪生神经网络Siamese Network)是一种特殊的神经网络结构,它包含两个相同的子网络,这两个子网络共享相同的参数。这两个子网络可以是不同类型的神经网络,例如一个是LSTM,另一个是CNN。孪生神经网络主要用于解决两种分类问题。 第一种分类问题是分类数量较少,每一类的数据量较多的情况,比如ImageNet、VOC等。这种问题可以使用神经网络或者支持向量机(SVM)等算法来解决,前提是我们事先知道了所有的类别。 第二种分类问题是分类数量较多(或者无法确认具体数量),每一类的数据量较少的情况,比如人脸识别和人脸验证任务。在这种情况下,孪生神经网络可以通过学习两个输入之间的相似度来进行分类。例如,在人脸验证任务,我们可以将两张人脸图像输入到孪生神经网络网络会输出一个表示两张图像相似度的值,从而判断这两张图像是否属于同一个人。 三元组神经网络(Triplet Network)是一种用于学习特征表示的神经网络结构。它通过使用三个样本:锚定样本(Anchor Sample)、正样本(Positive Sample)和负样本(Negative Sample),来训练网络。锚定样本和正样本属于同一类别,而负样本属于不同类别。三元组神经网络的目标是使锚定样本与正样本之间的距离尽可能小,而与负样本之间的距离尽可能大。通过这种方式,网络可以学习到更好的特征表示,从而在分类和识别任务取得更好的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值