- 人体行为识别数据集:283,582个视频片段,包含386个类别,从tiktok收集而来;
- 现有的人体行为识别数据集:
– UCF101:https://arxiv.org/pdf/1212.0402
– HMDB-51:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6126543
– Kinetics Human Action Video dataset:https://arxiv.org/pdf/1705.06950
– SomethingSomething:https://openaccess.thecvf.com/content_ICCV_2017/papers/Goyal_The_Something_Something_ICCV_2017_paper.pdf - 本文提出的数据集的优势:由网络平台收集,包含多样性的现实场景,摄像头移动多样,多样的光照条件;
- 数据收集过程:首先获取hashtag list,之后就每个hashtag收集900个视频;然后使用PySceneDetect获取其中最长的子clip,之后进行sampling帧使用YOLOv8来检测人的存在,并卡阈值来决定最后保留的clip;