基于深度学习的３D骨架动作识别

最新推荐文章于 2024-05-08 09:44:38 发布

lgy_keira

最新推荐文章于 2024-05-08 09:44:38 发布

阅读量1.5w

点赞数 11

分类专栏： paper阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013608336/article/details/81070645

版权

关于２Ｄ视频动作识别，请移步这两篇博客1,博客2

３Ｄ骨架动作识别，现在主要有两种方法，一是用LSTM进行时序上的记忆，二是将骨架坐标转换成特殊的图片，用卷积网络进行特征提取以及记忆，三是将LSTM和CNN网络的结果进行融合
目前使用的最大数据集是NTU-RGBD，后来又出现了一个PKU-MMD，但这个数据集是一段视频包含多段动作，主要是用来做detection的。
这个领域的开源代码非常少，微软有几篇不错的文章，但都不开源，初学者表示很是头疼。以下每个分类按时间发布先后进行整理。也有可能有没看过的文章，本文大概介绍一些比较经典的用来做baseline的文章。
本问所讲的所有paper，输入信息都只有３ｄ骨架坐标。

基于lstm的３d骨架动作识别

因为骨架信息是３Ｄ坐标，两帧之间的变化非常明显，用lstm效果非常显著。基于深度学习的方法最开始也是从ＲＮＮ开始入手。然后在肢体各个部分的特征融合方面下功夫。
View Adaptive Recurrent Neural Networks for High Performance　Human Action Recognition from Skeleton Data　2017/4

最低0.47元/天解锁文章

关注

11
点赞
踩
98

收藏

觉得还不错? 一键收藏
13
评论
基于深度学习的３D骨架动作识别

关于２Ｄ视频动作识别，请移步这两篇博客1,博客2３Ｄ骨架动作识别，现在主要有两种方法，一是用ＬＳＴＭ进行时序上的记忆，二是将骨架坐标转换成特殊的图片，用卷积网络进行特征提取以及记忆。目前使用的最大最全的数据集是NTU-RGBD，后来又出现了一个，但这个数据集是一段视频包含多段动作，主要是用来做detection的。基于lstm的３d骨架动作识别因为骨架信息是３Ｄ坐标，两帧之间的变化...
复制链接

扫一扫

专栏目录

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。