视频中的自监督学习:Removing the background忽略视频的背景,学习robust的特征

Removing the Background by Adding the Background: Towards Background Robust Self-supervised Video Representation Learning

【知乎的一篇介绍,写的很详细】
【代码、论文】

  • 概述:
    CVPR2021的文章,也是自监督学习中pretext task的设计,其中的思考很值得咀嚼吸收。
    通篇提到的background,应该既有背景的意思,也有场景的意思
  • 上面的知乎链接介绍了文章的动机

【知乎原文】如果一个模型过多关注空间信息,则很容易产生误判 【比如只关注一帧图像】
Background是双刃剑,过多或者过少关注都不好~
目前常用的数据集中含有大量类别其动作语义和物体及场景强相关,比如通过是否看到吉他来判断是否为“弹吉他”动作,通过是否看到足球场地来判断是否为 "踢足球"动作,这种运动类别和静态物体以及静态场景强相关的现象称之为 Implicit Bias

【下面是我的转述】
在上述的数据集训练 CNN 的时候,那些跟【场景/背景、物体】关联性很高的类别(踢足球、弹吉他)就有比较好的分类效果,比较新奇或者要依靠时序信息才能分辨的类别,就难整了;
针对这个问题,传统的双流法 (rgb + flow)有帮助,因为RGB流、Flow流本身就较好地利用了 spatial 和 temporal 信息,但现在主流方法更多的使用 end-to-end 的3D网络,网络很容易陷入到 implict bias 中。

一、神奇的想法:通过添加background来去掉background

小标题可能不好理解,但其实就是上面提到的“文章的动机”:Back

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值