CVPR 2021 Removing the Background by Adding the Background: Towards Background Robust Self-supervise

动机

background cheating:目前常用的视频数据集通常对场景和目标结构存在较大的隐性偏差,使得时间结构变得不那么重要,即预测高度依赖于视频背景而不是运动,使得模型容易受到背景变化的影响。这种现象被命名为background cheating。

​ – 例如,一个训练过的模型可能仅仅因为看到了场地,就把一个动作归类为踢足球,而没有真正理解侧手翻的动作。

方法

Background Erasing (BE):为了防止模型的背景欺骗,使模型具有更好地泛化,本文提出通过增加背景来减小背景的影响,并鼓励模型在操作中学习一致的特征。具体地说,给定一个视频,随机选择一个静态帧,并将其添加到每个其他帧中作为噪音,以构建一个注意力分散的视频序列。该模型由一个已有的自监督任务和一个一致性约束来训练。通过一致的正则化,强制使模型将注意力分散的视频的特征和原始视频的特征拉近,从而明确限制背景对模型的影响,更多地关注运动变化。通过对视频背景进行打乱,要求其特征与原始视频一致,达到使模型不过度依赖背景的目的,从而缓解背景欺骗问题。

如下图所示。对于每个输入视频,首先从不同的空间位置随机裁剪两个固定长度的剪切视频,分别对这两个数据进行数据增强,保证输入的剪切视频在像素层次上分布不同,但在语义层次上一致。将两个剪切视频直接输入到三维主干中提取特征表示,首先通过增加的语义不变的静态帧噪声的干扰,生成对应的两个注意力分散的视频特征,将两个视频特征通过现有的自监督方法强制拉近。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值