VideoMoCo论文笔记

最新推荐文章于 2024-09-14 20:22:29 发布

0yumiwawa0

最新推荐文章于 2024-09-14 20:22:29 发布

阅读量856

点赞数 15

分类专栏： # CVPR2021 文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yumiwawa19960506/article/details/140867628

版权

CVPR2021 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

MoCo 方法回顾

把对比学习看成了一个分类问题，用当前图像上提取到的 feature $q$ 与当前图像进行 augmentation 得到的 feature $k_+$ 以及其他图像上提取到的 feature $k$ 分别计算内积，内积的结果作为分类概率，并用交叉熵损失函数进行优化：
$L_q=-\log{\frac{\exp(q\cdot k_+/\tau)}{\sum_{i=0}^K\exp(q\cdot k_i/\tau)}}$ 本质是一个分类问题，希望同一张图片经过不同 augmentation 提取的特征能分到一类，不同的图片提取到的特征分到不同的类。
训练过程中，query_encoder 是直接训练的，key_encoder 是根据 query_encoder 逐渐更新的：
$\theta_k\leftarrow m\theta_k+(1-m)\theta_q$
这是为了保证 key 尽量稳定，否则如果 key_encoder 变化太快的话，提取到的 feature 差异就会很大，再去比较 feature 是不是一致就没有意义了，因为网络都变了。

VideoMoCo 的改进

Temporally Adversarial Learning

截屏2024-08-01 18.36.10.png
该模块可以看作在时间维度上进行的 augmentation，通过对抗训练使 encoder 在时间维度上更稳定。生成器预测每一帧的重要性，并且删掉其中 25%最重要的帧，判别器希望抽帧后提取的特征与抽帧前相同。这里与一般的 GAN 思路略有差别，VideoMoCo 里生成器希望生成的视频尽量不同，判别器希望学到的特征尽量相同。

Temporal Decay

越早计算的 key，采用的模型与 query 差距越大，因此 VideoMoCo 根据 key 进入队列的时间，逐步降低了 key 的权重：

$L_q=-\log{\frac{\exp(q\cdot k_+/\tau)}{\sum_{i=0}^Kt^i\cdot\exp(q\cdot k_i/\tau)}}$

Experiments

截屏2024-08-02 11.07.45.png

关注

15
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

0yumiwawa0 CSDN认证博客专家 CSDN认证企业博客

码龄9年

12: 原创

102万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

310: 积分

120: 粉丝

145: 获赞

0: 评论

160: 收藏

私信

关注

热门文章

分类专栏

最新评论

TC-LLaVA论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
MONA论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
RT-DETR论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
On Calibration of Modern Neural Networks论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Deformable DETR论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。