NTU-RGBD CVPR2016
总共大约有56000个视频,60类动作,50类是单人动作,10类是双人交互动作。每个人捕捉了25个关节点。数据集有两种分割方式,cross subject 和cross view ,这也是目前最大最全的一个数据集。很多动作识别的论文都是以这个数据集作为检测标准。
包含四种类型的数据,RGB videos、 depth map sequences 、3D skeletal data、infrared videos
精度:
MSR-Action3D
20类动作,10个人,重复2到3次。总共有567个sequence,depth和skeleton 数据,没有RGB数据,其中有10个sequence有错误,skeleton丢失掉了,帧率15fps
SBU
共284个视频,8类动作,7个人,用5折交叉验证,最长46frame,本数据集的动作全是双人交互动作,有RGB、skeleton、depth图片。骨架关节点有15个
动作分类:靠近, 远离, 踢 ,推,握手,拥抱,递书本,拳击
x and y are normalized as [0,1] while z is normalized as [0,7.8125]
SYSU
kinect捕捉的数据集,包含12