论文不详细解读（一）——MoCo系列

一豆豆酱

已于 2023-07-17 17:17:28 修改

阅读量519

点赞数

分类专栏：论文笔记文章标签：机器学习人工智能深度学习

于 2023-06-25 20:58:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44965314/article/details/131384235

版权

MoCo系列介绍了自监督学习中的对比学习方法，通过MoCov1、v2和v3的演进，探讨了负样本队列、动量更新和训练稳定性对模型性能的影响。MoCov3在ViT上的应用突显了训练不稳定性问题，提出了冻结第一层参数以提高训练稳定性的策略。

摘要由CSDN通过智能技术生成

引言：
自监督发展时间线
在这里插入图片描述
图来自：https://zhuanlan.zhihu.com/p/381354026

1. MoCo v1

论文名称： Momentum Contrast for Unsupervised Visual Representation Learning

开源地址：https://github.com/facebookresearch/moco
大佬详细解读：https://zhuanlan.zhihu.com/p/382763210

motivation

原始的端到端自监督方法：
给定样本 $x_q$ ，数据增强得到正样本 $x_k$ ，batch内的其余样本作为负样本

原始样本 $x_q$ 输入到Encoder $f_q$ 中，正样本和负样本均输入到Encoder $f_k$ 中，通过Contrastive loss来更新2个Encoder $f_q$ 和 $f_k$ 的参数

Contrastive loss一般为InfoNCE:
在这里插入图片描述
【插入一个参考资料：对比学习损失（InfoNCE loss）与交叉熵损失的联系，以及温度系数的作用】

毫无疑问，batch size 越大效果越好，但是受显存影响（2个encoder的全量数据都用于更新两个encoder的参数），batchsize不能设置过大，如何获得更多的负样本？

MoCo v1之前的做法：
正样本的生成方式不变（数据增强），采用一个较大的memory bank 用来存储负样本，每次训练从中采样一批负样本出来 $k_{sample}$ ，loss只更新Encoder $f_q$ 的参数，和几个采样的 $k_{sample}$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文不详细解读（一）——MoCo系列

队列存满会把最旧的样本batch替换成最新的batch，队列长度K不是样本总数量，而是远远小于总数量的（65535 vs 几百万），所以queue内存在和query正样本的概率比较小。1） queue实际存的是负样本的embbeding，为了方便计算loss 所以用的是tensor形式，负样本进出队列实际使用一个索引 ptr 显示的样本替换位置。m=0说明两个encoder的参数完全一致，而端到端的训练，是两个网络均使用梯度更新，网络参数不一定一致，所以训练不会失败。
复制链接

扫一扫

专栏目录

一豆豆酱 CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

56万+: 周排名

79万+: 总排名

5万+: 访问

: 等级

595: 积分

7: 粉丝

36: 获赞

20: 评论

99: 收藏

私信

关注

热门文章

分类专栏

论文笔记 2篇
Python基础 8篇

最新评论

Ubuntu打不开pycharm的解决方法
2301_82273762: 能详细点嘛，代码怎么写啊？
Ubuntu打不开pycharm的解决方法
2301_81907591: 真的行
论文不详细解读（二）——SimCLR系列
CSDN-Ada助手: 恭喜您撰写第18篇博客！标题中的“SimCLR系列”引起了我的兴趣，我很期待能够阅读您详细解读的内容。您对论文的深入解读让我感到钦佩，这对读者来说是一个宝贵的学习资源。我认为，下一步您可以考虑将更多的实际案例和应用场景融入到您的博客中，这样能够使读者更好地理解和应用相关知识。谢谢您的分享，期待您未来更多精彩的创作！
Python报错：module 'scipy' has no attribute 'xxx'
Ression: 噢噢谢谢当时没看到您的消息，我是把scipy换成了np，也能解决
Python报错：module 'scipy' has no attribute 'xxx'
A11280304: 我直接把它删了，只保留了括号里面的东西

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。