一、输入是什么
视频,可以进一步分为短视频和长视频
二、输出是什么
视频中人体动作类别信息
三、算法输入的数据模态
基于RGB视频、基于深度图序列、基于骨架序列、基于多模态数据
四、聚焦基于骨架序列
经典模型:ST-GCN、AS-GCN
推荐文献:Yan S J, Xiong Y J, Lin D H. Spatial temporal graph convolutional networks for skeleton-based action recognition[C]//Proceedings of the 32nd AAAI Conference on Artificial Intelligence. Palo Alto: AAAI Press, 2018: 7444-7452
Li M S, Chen S H, Chen X, et al. Actional-structural graph convolutional networks for skeleton-based action recognition[C] //Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Los Alamitos: IEEE Computer Society Press, 2019: 3590-3598
参考:
刘宝龙, 周森, 董建锋, 等. 基于骨架的人体动作识别技术研究进展[J]. 计算机辅助设计与图形学学报, 2023, 35(9): 1299-1322