【数据集整理】人体行为识别和图像识别

最新推荐文章于 2024-01-25 01:53:02 发布

故沉

最新推荐文章于 2024-01-25 01:53:02 发布

阅读量9.8k

点赞数 2

分类专栏： AI_Club 文章标签：数据集人体行为识别图像识别

AI_Club 专栏收录该内容

15 篇文章 3 订阅

订阅专栏

原链接：https://blog.csdn.net/liuxiao214/article/details/78889662

谢谢博主的整理，转载一下以便查阅。

一共12个人体行为识别的数据集，基于视频的；

6个图像识别的，有关物体识别、行人识别、年龄识别和人头检测的，基于图像，图像识别数据集参考于博客：http://blog.csdn.net/qq_14845119/article/details/51913171

后续可能还会补充。

视频识别

1、Weizmann

内容：

1、10个类别，每个类别9个视频，背景单一。
2、180x144

下载链接： http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html

2、KTH

内容：

1、共25个人采集，6个类别，每个类别4个情境，3中室外，1种室内，共600个视频。
2、给出了每个视频4个片段的始末帧位置。
3、规格：160x120，25fps。

下载链接： http://www.nada.kth.se/cvap/actions/

3、Fire Detection

内容： 共6个视频，火灾检测。

下载链接： http://crcv.ucf.edu/data/fire.php

4、UCF101

内容：

1、共13320个视频101个类别，从YouTube采集的真实场景。
2、分为5大类：人与物交互、baby动作、人人交互、乐器演奏、运动。
3、规格：320x240，25fps，最小视频为28帧。

下载链接： http://crcv.ucf.edu/data/UCF101.php

5、HMDB51

内容：

1、共51个类别，6849个视频。每一个类别至少包含101个视频。
2、从电影、视频网站上采集。
3、包含5大类：面部动作（微笑、大笑、咀嚼、说话）；面部与物交互动作（吃饭、喝水、抽烟）；身体运动（翻跟斗、拍手、爬上等）；身体与物交互运动（梳头发、拔剑等）；人人交互运动（击剑、拥抱、接吻等）

下载链接： http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset

6、VISAL

内容：

1、包含很多数据集，船只数据、纹理合成数据、交通拥挤数据、拥挤人群数据UCSD（行人、人注释、人数、线划分）、人3D姿态数据MADS。
2、可下载拥挤人群和人姿态。

下载链接： http://visal.cs.cityu.edu.hk/downloads/

7、Monitoring Human Activity

内容：

1、数据量很小，且需要单独下载，有空可下载。

下载链接： http://mha.cs.umn.edu/index.shtml

8、HOLLYWOOD2

内容：

1、人体动作：12个类别。
2、场景：10个类别。
3、共3669个视频，20.1个小时。
4、从69部电影中采集。
5、视频样本中行为人的表情、姿态、穿着，以及相机运动、光照变化、遮挡、背景等变化很大，接近于真实场景下的情况，因而对于行为的分析识别极具挑战性。

下载链接： http://www.di.ens.fr/~laptev/actions/hollywood2/

9、YouTube-8M

内容：

1、800万个标注视频，每个视频120s到500s。

下载链接： https://research.google.com/youtube8m/

10、Moments in Time Dataset

内容：

1、100万个标注视频，每个视频3秒。

下载链接： http://moments.csail.mit.edu/

11、TRECVID

内容：

如何下载，没看明白，暂时先不管。

下载链接： http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1

12、CMU Graphics Lab Motion Capture Database

内容：

应该是一些骨骼点动作捕捉，下载链接分散，很难下载，需要写脚本。

下载链接： http://mocap.cs.cmu.edu/

图像识别

1、ImageNet

内容： 物体识别

ImageNet是一个计算机视觉系统识别项目，是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像，是已知的最大的图像数据库。

下载链接： http://www.image-net.org/

2、CIFAR

内容： 物体识别

CIFAR-100由60000张图像构成，包含100个类别，每个类别600张图像，其中500张用于训练，100张用于测试。其中这100个类别又组成了20个大的类别，每个图像包含小类别和大类别两个标签。官网提供了Matlab,C，python三个版本的数据格式。

下载链接： http://www.cs.toronto.edu/~kriz/cifar.html

3、INRIA Person Dataset

内容： 行人检测

Inria数据集是最常使用的行人检测数据集。其中正样本（行人）为png格式，负样本为jpg格式。里面的图片分为只有车，只有人，有车有人，无车无人四个类别。图片像素为70*134，96*160，64*128等。

下载链接： http://pascal.inrialpes.fr/data/human/

4、CaltechPedestrian Detection Benchmark

内容： 行人识别

下载链接： http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/

5、Adience

内容： 性别年龄识别

该数据集来源为Flickr相册，由用户使用iPhone5或者其它智能手机设备拍摄，同时具有相应的公众许可。该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时，里面还进行了相应的landmark的标注。是做性别年龄估计和人脸对齐的一个数据集。图片包含2284个类别和26580张图片。

下载链接： http://www.openu.ac.il/home/hassner/Adience/data.html#agegender

6、HollywoodHeads dataset

内容： 人头检测

该数据集为从视频中截取的图片，包含224740张jpeg格式图片，还有xml格式的标注，和VOC的标注方式一样。

下载链接： http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip

故沉

关注

2
点赞
踩
66

收藏

觉得还不错? 一键收藏
0
评论
【数据集整理】人体行为识别和图像识别

原链接：https://blog.csdn.net/liuxiao214/article/details/78889662谢谢博主的整理，转载一下以便查阅。一共12个人体行为识别的数据集，基于视频的；6个图像识别的，有关物体识别、行人识别、年龄识别和人头检测的，基于图像，图像识别数据集参考于博客：http://blog.csdn.net/qq_14845119/article/d...
复制链接

扫一扫