TAM: TEMPORAL ADAPTIVE MODULE FOR VIDEO RECOGNITION ∗
主要贡献
由于摄像机运动、速度变化和不同活动等因素的影响,视频数据具有复杂的时间动态特性。为了有效地捕获这种不同的运动模式,本文提出了一种新的时间自适应模块(TAM),该模块基于其自身的特征映射,共同生成特定于视频的时间核。
TAM
X ∈
R
C
×
T
×
H
×
W
R^{C×T×H×W}
RC×T×H×W表示一段视频的特征图,C代表通道数,T、H、W是时空维度。
聚合空间信息,维度变为C×T。
TAM的公式表示:
实验
超参数
Study on the effectiveness of TAM.
Comparisons with the state-of-the-art methods on Kinetics-400.