分享一篇来自 CVPR 2021 的文章,ACTION-Net: Multipath Excitation for Action Recognition。作者单位:都柏林圣三一大学,字节跳动 AI Lab。
论文中提出一个即插即用的混合注意力机制的 ACTION 模块用于时序动作识别 (比如手势)。该模块包含了时空注意力,信道注意力和运动注意力。
详细信息如下:
论文链接:https://arxiv.org/abs/2103.07372
项目链接:https://github.com/V-Sense/ACTION-Net
01
三个注意力机制模块
时空注意力 (Spatial-Temporal Excitation: STE):通过对所有信道做一个global average pooling,能够用一个单信道的3x3x3的3D卷积得到一个单信道的时空attention map,这使