视频分类/动作识别
文章平均质量分 83
Republix
这个作者很懒,什么都没留下…
展开
-
视频中的自监督学习:Removing the background忽略视频的背景,学习robust的特征
Removing the Background by Adding the Background: Towards Background Robust Self-supervised Video Representation Learning【知乎的一篇介绍,写的很详细】【代码、论文】概述:CVPR2021的文章,本质上也是自监督学习中pretext task的设计,其中的思考很值得咀嚼吸收。通篇提到的background,理解为“场景”更好一些上面的知乎链接介绍了文章的动机:… 如果.原创 2021-06-09 23:37:04 · 830 阅读 · 4 评论 -
视频中的自监督学习:Predicting Motion and Appearance Statistics
Self-supervised Spatio-temporal Representation Learning for Videos by Predicting Motion and Appearance Statistics2019年的CVPR文章,作者所设计的pretext task是由运动、颜色衍生出来的统计量(具体来说是最大的动作位置以及方向,颜色改变最大 / 最小的位置以及颜色的值),在文章的Introduction中作者提到了动作的表示在人的视觉系统中是基于一系列learned pattern原创 2021-04-12 23:21:29 · 1374 阅读 · 3 评论 -
视频中的自监督学习:3篇“重构”的论文
在之前Space-Time Cubic Puzzles的论文中,就提到了一些用重构的方式,来提取视频时空特征的论文,这里粗略过一下Generating Videos with Scene Dynamics-NIPS-2016说的是把GAN推广到视频上,新奇的是网络分了foreground stream和background stream,其中foreground是三维的反卷积做上采样,合成视频;background顾名思义是背景,就是二维的反卷积,这个stream生成的图片作为背景,在时域上是不变的。原创 2021-04-09 21:29:15 · 400 阅读 · 0 评论 -
视频中的自监督学习:Space-Time Cubic Puzzles
视频中的自监督学习——Space-Time Cubic Puzzles论文:【Self-Supervised Video Representation Learning with Space-Time Cubic Puzzles】原创 2021-04-06 17:33:34 · 534 阅读 · 0 评论 -
视频中的无监督学习:Deep Nerual Embeddings
视频中的无监督学习ECCV-2020 Unsupervised Learning from Video with Deep Neural Embeddings概括:通过定义在视频嵌入分布上的损失函数,利用不同视频内部和不同视频之间的关系All these works only operate on relationships defined within a single video, differentiating them from VIE, which exploits the relat原创 2021-04-01 16:55:41 · 513 阅读 · 0 评论