基于深度学习的人体姿态识别算法总结

from: https://zhuanlan.zhihu.com/p/27657196

1. 写在前面

大概两个月前,接到一个小任务,要做一个深度学习在人体姿态识别领域的一些调研,以前也没做调研相关的事情,连格式怎么写都不知道,前前后后看了接近20篇论文,然后就写下来这篇小总结,感觉都不能算是调研,文章主要列出了一些相关的数据集以及深度学习的方法包括基于无监督学习的行为识别、基于卷积神经网络的行为识别、基于循环神经网络以及一些拓展模型的方法。当然,这里面提到的很多模型都不是最新的技术,还有很多最新的模型和技术都没有包含进来。

因为这篇文章写出来已经很久了,所以很多东西记得都有些模糊,这次只是将原来的md文件拿过来排个版,如果有哪里有什么问题,请指正,谢谢。

2. 本文结构

本文首先提出一共17个人体姿态识别相关的数据集及其链接,然后给出9个深度学习在人体姿态识别领域的应用模型,包括其论文提出的思路、模型结构、实验数据集和使用的加速硬件(如果有的话),本文不提供相关的实现方法。

3. 数据集

3.1 KTH

链接

介绍:视频数据集包括六种动作(走、慢跑、快跑、拳击、挥手和鼓掌),所有动作由25个人分别演示,并且融合了四种场景进行演示,一共有25 \times 6 \times 4 = 600个AVI视频文件。

3.2 Weizmaan

链接

介绍:一共有90个视频文件,由9个人展示,每个人展示十种动作。

3.3 HOHA

链接

介绍:从电影中采集的真实的人类活动。

3.4 Keck Gesture

链接

介绍:包含14中不同手势(军用信号),使用彩色相机拍摄,分辨率为 640 \times 480,每个手势都有三个人演示,每个视频序列中,一个人重复演示三次同样的手势,训练的一共有3 \times 3 \times 14 = 126个视频序列。并且拍摄角度固定背景也固定。测试的一共4 \times 3 \times 14 = 168个视频序列,并且使用运动相机拍摄并且处于杂乱且有移动物体的背景中。视频格式为AVI。

3.5 MSR action

链接

介绍:数据集包含16个视频序列,并且一共有63个动作,每一个视频序列包含复合动作,一些序列不同人的不同动作,同时有室内和室外场景,所有的视频都是在杂乱并且移动的背景中。视频分辨率为320 \times 240,帧率为15fps,视频序列的长度在32~76秒之间

3.6 YouTube Action

链接

介绍:包含11种动作类,对于每一类动作,视频分为25组, 每一组有4个动作(分在同一组的视频有着一些共同的特征)

3.7 UT-Interaction

链接

介绍:提供了一个人-人交互的数据集。包括6类动作,一共有20个视频序列(时长约1分钟),分辨率为720 \times 480,帧率30fps。

3.8 TRECVID Data Availability

  • 6
    点赞
  • 80
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值