论文笔记:SlowFast Networks for Video Recognition
论文笔记:SlowFast Networks for Video Recognition
灵魂三问:
作者想干什么?
提取视频信息
是怎么实现的?
通过分别低采样和高采样
低采样:提取空间语义(spacial sematics)
高采样:提取时域上的运动
实现了什么目标?
在动作识别以及检测都有很显著提升
测试集:Kinetics, Charades, AVA,
Intuition
在图片中,I(x,y)I(x,y)I(x,y) 有各向同性 (isotropic), 那么视频信号
原创
2020-07-24 16:11:47 ·
217 阅读 ·
0 评论