ICLR22 VICReg VARIANCE-INVARIANCE-COVARIANCE REGULARIZATION FOR SELF-SUPERVISED LEARNING

最新推荐文章于 2024-04-26 09:37:37 发布

Complicated__76

最新推荐文章于 2024-04-26 09:37:37 发布

阅读量442

点赞数

分类专栏： GNN-SSL learning 文章标签：机器学习深度学习算法

本文链接：https://blog.csdn.net/qq_40926715/article/details/127512344

版权

GNN-SSL learning 专栏收录该内容

37 篇文章 12 订阅

订阅专栏

talk

Lecun组的， Barlow Twins的后续工作，在Barlow Twins的基础上增加了一个 variance损失

1.model

encoder是Siamese网络，共享参数。作者在文中也说可以是不同的网络结构，但他们采用simamese网络，有个类似projection的part，只是预训练的时候用。之后就采用encoder的表征作为下游任务。作者说：第二项采用标准差而并非方差很关键，如果是采用方差，当两个x很接近，梯度就变成0，模型就崩了。同时文章计算的时候不需要进行正则。

1.1整体

采用裁剪，颜色失真来生成两个视图，经过encoder 学到h。 h经过expander学到z，z计算损失

1.2 损失

在这里插入图片描述

第一项损失：不变项 invariance。

样本对之间均方误差。两个视图Z进行表征相减。

在这里插入图片描述

核心：第二项损失

variance项，来保证模型不崩塌（不映射到相同的向量）。 两个表征自身 、

在这里插入图片描述
hinge损失，zj是z的第j维，相当于是每个维度都进行变化，S是标准差，ε是小常数来防止数值上不稳定。
损失使得每个batch的 variance都等于γ，γ是一个目标常数（对于标准差）。这里S的计算是采用这样的标准差，而非方差，防止了样本梯度=0，模型崩塌。
在这里插入图片描述

第三项损失： covariance损失 – BT的损失

表征非对角元素和。这个损失使得 表征不同 维度（特征）不相关，防止不同维度编码相似信息。

在这里插入图片描述
协方差矩阵，损失是矩阵的非对角元素之和。

这篇文章投 NIPS21被拒了。因为和他们组里的barlow twins太像了。重新转投了iclr22. 文章作者强调第二项损失至关重要（他们新提出来的）。

Complicated__76

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ICLR22 VICReg VARIANCE-INVARIANCE-COVARIANCE REGULARIZATION FOR SELF-SUPERVISED LEARNING

对比学习cv。 Barlow twins后续工作
复制链接

扫一扫