论文阅读——MoCo：Momentum Contrast for Unsupervised Visual Representation Learning

最新推荐文章于 2024-04-16 14:19:48 发布

coding小白

最新推荐文章于 2024-04-16 14:19:48 发布

阅读量954

点赞数

分类专栏：自监督学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44317766/article/details/113100509

版权

自监督学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

不放翻译了，大家喜欢的可以搜索题目去谷歌学术下载~

样本数量对于对比学习很重要，提出一种动量对比的方法来提高每个mini-batch中负样本的数量。左边的是查询的样本，右侧的是一个字典，存储的是一组数据样本，分别通过不同的编码器网络提取特征，通过最小化特征之间的对比损失函数进行编码网络的更新。

在这里插入图片描述

x_q代表某一图片p_q的图像增强操作（包括旋转、平移、裁剪等）后的一个矩阵;
x_k代表多张图片p_k（p_k中包含p_q）的图像增强操作之后的多个矩阵;
Encoder、momentum encoder代表两个编码网络，这两个网络的结构相同，参数不同
q代表x_q经过encoder网络编码之后的一个向量
k代表x_k经过momentum encoder网络编码之后的多个向量

文章的目标函数采用的是InfoNCE：

在这里插入图片描述

特点是动态字典，这里的动态体现在了字典的大小是一个超参数，每一次将batchsize大小的样本送入字典，当队列满的时候，会将最旧的一批淘汰。此外还可以保证一致性，对于字典的反向传播来说，网络的参数受到每个样本的影响，而字典中包含了大量的样本，那么每一次反向传播的过程对于字典的编码器网络的变化太大，从而导致提取特征的一致性过低，所以采用的是动量更新的方法。（待进一步理解）

参考链接：
https://zhuanlan.zhihu.com/p/132550481
https://zhuanlan.zhihu.com/p/275750619?utm_source=wechat_session

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读——MoCo：Momentum Contrast for Unsupervised Visual Representation Learning

不放翻译了，大家喜欢的可以搜索题目去谷歌学术下载~样本数量对于对比学习很重要，提出一种动量对比的方法来提高每个mini-batch中负样本的数量。左边的是查询的样本，右侧的是一个字典，存储的是一组数据样本，分别通过不同的编码器网络提取特征，通过最小化特征之间的对比损失函数进行编码网络的更新。x_q代表某一图片p_q的图像增强操作（包括旋转、平移、裁剪等）后的一个矩阵;x_k代表多张图片p_k（p_k中包含p_q）的图像增强操作之后的多个矩阵;Encoder、momentum encoder代
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。