前面:自己整理下面的东西出来后,觉得有点意思,当时就总结出来了一篇很水的综述论文,发表肯定发表不了,纯属锻炼写作的,博大家一乐。
论文题目:A Survey on 3D Skeleton-Based Action Recognition Using Learning Method
链接:https://arxiv.org/abs/2002.05907链接
首先,以后工作可以考虑一下基于图卷及的行为识别今年很多,且在数据集上性能领先。
如下图所示:
应用场景:
- 【2019】Skeleton-based Action Recognition of People Handling Objects 【论文】
- recognizing object-related human actions
- 偏向于应用场景
- 通过构建skeletion-graph 利用了图卷积
CNN-Based:
- 【2019】SkeleMotion: A New Representation of Skeleton Joint Sequences Based on Motion Information for 3D Action Recognition【论文】 【代码】
- Skeleton -> Image
- 偏向于方法
- 3D 行为识别
- CNN方法
- NTU RGB+D 120 dataset
- skeleton image representation 重要!!!对骨架序列进行编码,进一步表示,高效表示,skeleton->Image,有点像师兄的思路!
2. 【2019】Three-Stream Convolutional Neural Network With Multi-Task and Ensemble Learning for 3D Action Recognition【论文】
- 数据集:NTU RGBD
- 3D 行为识别
- 思路:三个stage
- 偏向于方法,网络结构上的创新!
- 多任务学习
此外他还有一篇文章是考虑了频域信息进去的,结构差不多
如下,主要讲当前的方法都是异步学习语义信