Barlow Twins：Self-Supervised Learning via Redundancy Reduction论文阅读

最新推荐文章于 2024-05-30 21:43:43 发布

MiHao_YOUNG

最新推荐文章于 2024-05-30 21:43:43 发布

阅读量528

点赞数

分类专栏：论文阅读文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/Mi_Hao_YOUNG/article/details/120099573

版权

5 篇文章 1 订阅

订阅专栏

Barlow Twins论文阅读

论文地址
Barlow Twins一种自监督学习的方法

创新

对比于之前的BYOL，Simsiam非对称自监督学习网络，Barlow Twins采用对称结构
- 并且没有momentum，predictor，stop-grad结构
设计了一种新的loss计算方法来避免坍塌
- 计算两个网络输出vector的相似度，得到一个cross-correlation matrix（互相关矩阵），使得该矩阵逼近一个单位矩阵
- 互相关矩阵的主对角线要接近单位矩阵，即同一样本在不同的图像增强下，网络提取的特征表示非常相似，保证 $z^{A}_{i}$ 和 $z^{B}_{i}$ 的相关性
- 非主对角线的元素要接近0，解耦特征向量不同的分量，使得特征向量分量间的冗余最小化，即特征向量已经保证 $z^{A}_{i}$ 和 $z^{B}_{i}$ 的相关性了，就不要再让 $z^{A}_{i}$ 和 $z^{B}_{j}$ 具有相关性了
模型的性能随着特征维度增强而增强

结构

伪代码

Linear evaluation in ImageNet

Semi-supervised training on ImageNet

不同的loss function

Batch size

对于batch size比较敏感

图像增强

对图像增强策略敏感

特征维度

实验中，对于16384维度，模型依然没有趋于饱和状态，可能存在进步空间

引入predictor和stop-grad

关注

专栏目录