论文
winniewu1998
cv小白,初级炼丹师
展开
-
(NeurIPS2020)Self-supervised Co-trainingfor Video Representation Learning
InfoNCE本质上是做一个Instance Discrimination,从样本出发经过data augmentation之后生成positive ,然后再通过cross etropy分类使其概率最大。但是存在一个问题,即负样本中存在许多样本与样本的semantic label应该是一样的,故作者提出了一个supervised contrastive learning的形式(UberNCE),将semantic label相同的样本当作positive,不同的则当作negative.而rgb...原创 2021-08-16 14:42:08 · 464 阅读 · 1 评论 -
(CVPR 2021)Self-supervised Video Representation Learning by Context and MotionDecoupling
目前video understanding 中存在一个context bias的一个问题,即网络判断动作的时候并不是根据动作motion信息判断,而是根据context 静态场景判断。故本文提出了一个pretext task,直接使用compressed video中的key frame 和motion vector来进行对比学习,以此摆脱context bias这个问题。任务有两部分,context matching 和motion prediction两部分。主要框架:...原创 2021-08-16 10:54:50 · 630 阅读 · 0 评论 -
(CVPR2021) Video MoCo: Contrastive Video Representation Learning with Temporally Adversarial Example
使用对抗的方法,引入了对于robust的正样本,具体方式为使用lstm随机drop掉video clip中的一些帧,同时由于负样本的队列中,越早进入的样本与正样本的差距越大,故给队列中的负样本一个权重系数(小于1),越新的样本权重越大。损失函数:生成器:判别器:实验结果:结论:...原创 2021-08-16 10:04:57 · 910 阅读 · 0 评论 -
论文阅读(2021.8)
本人资源汇总帖:汇总帖论文阅读:原创 2021-08-01 11:30:58 · 87 阅读 · 0 评论