论文地址:Action Localization Using 2D-CNN and 3D-CNN Collaboration
1. 整体架构流程
用于动作定位的实时检测架构:
(1) 一个分支通过2D分支提取关键帧的空间特征以解决定位任务。
(2) 另一个分支则通过3D分支并行提取由先前帧组成的剪辑的时空特征以进行类别预测。
2.技术细节
本模型损失函数包括两部分,一部分为3D-CNN 的类别损失,另一部分为 2D-CNN的边框损失。这两部分单独训练,互不影响。
训练好的模型进行一个选取(也可以使用YOLO自带的方法)
3.初步实验对比