[论文阅读 2020 Arxiv 自监督对比学习]Exploring Simple Siamese Representation Learning

最新推荐文章于 2023-04-26 19:56:54 发布

lingqing97

最新推荐文章于 2023-04-26 19:56:54 发布

阅读量2.7k

点赞数 3

分类专栏：论文阅读文章标签：深度学习人工智能机器学习算法

本文链接：https://blog.csdn.net/qq_39621037/article/details/116028936

版权

论文阅读专栏收录该内容

19 篇文章 5 订阅

订阅专栏

简介

paper:Exploring Simple Siamese Representation Learning

code:暂未开源，可参考PatrickHua/SimSiam

Kaiming He大神的自监督学习新作。这篇论文相比于之前的SimCLR、BLOY,不需要negative sample pairs、large batches、momentum encoders,可以说是将基于孪生网络的自监督模型简化到了极致，而这也是这篇论文想引导大家思考的，即基于孪生网络的自监督学习模型中，究竟是什么在起作用。

主要内容

在这里插入图片描述

如上图所示，是SimSiam的主要结构,整个模型非常简单:

对图片 $x$ 进行随机图像增强得到 $x_1$ 和 $x_2$ ;
将 $x_1$ 和 $x_2$ 输入到encoder network $f$ (encoder $f$ 共线参数),其中 $f$ 由一个backbone(e.g.,ResNet)和一个projection MLP head组成.
之后，将其中一个输出输入到一个prediction MLP head $h$ 中，最后计算两个分支的negative cosine similarity.

用数学公式表示为:

$p_{1} \triangleq h\left(f\left(x_{1}\right)\right)$
$z_{2} \triangleq f\left(x_{2}\right)$
$\mathcal{D}\left(p_{1}, z_{2}\right)=-\frac{p_{1}}{\left\|p_{1}\right\|_{2}} \cdot \frac{z_{2}}{\left\|z_{2}\right\|_{2}}$

where $\|\cdot\|_{2}$ is $l_2$ -norm.

为了防止出现collapse的问题，这篇论文使用了stop-gradient(论文后文重点说明这个是关键),即:

$\mathcal{D}\left(p_{1}, \text { stopgrad }\left(z_{2}\right)\right)$

将 $x_1$ 和 $x_2$ 交换位置后可以得到另一半损失，最终的损失函数可以表示为:

$\mathcal{L}=\frac{1}{2} \mathcal{D}\left(p_{1}, \text { stopgrad }\left(z_{2}\right)\right)+\frac{1}{2} \mathcal{D}\left(p_{2}, \text { stopgrad }\left(z_{1}\right)\right) .$

Here the encoder on $x_2$ receives no gradient from $z_2$ in the first term, but it receives gradients from $p_2$ in the second term (and vice versa for $x_1$ ).

整个算法用伪代码表示为:

在这里插入图片描述

实验验证

这篇论文用了大量实验在分析避免collapse的因素,试图寻找基于孪生网络的自监督学习模型的学习核心。

在这里插入图片描述

从上图可以看出，如果不使用stop-gradient模型不work！

在这里插入图片描述

上面这个图说明了去除掉prediction $h$ 模型也不work!

在这里插入图片描述

上面这个图说明了SimSiam不需要大的batch size.

论文中，作者还试图从EM模型的角度分析stop-gradient起作用的原因，感兴趣的可以阅读原文.

实验结果

在这里插入图片描述

小结

自监督对比学习领域真是越来越热闹了,MocoV1、SimCLR、BLOY,SwAV,包括这篇的SimSiam,都在挖掘基于孪生网络的自监督学习模型的潜力，我等闲人也就只能吃吃瓜了。

lingqing97

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[论文阅读 2020 Arxiv 自监督对比学习]Exploring Simple Siamese Representation Learning

简介paper:Exploring Simple Siamese Representation Learningcode:暂未开源，可参考PatrickHua/SimSiamKaiming He大神的自监督学习新作。这篇论文相比于之前的SimCLR、BLOY,不需要negative sample pairs、large batches、momentum encoders,可以说是将基于孪生网络的自监督模型简化到了极致，而这也是这篇论文想引导大家思考的，即基于孪生网络的自监督学习模型中，究竟是什么在起作
复制链接

扫一扫