近期在做在线动作识别的项目,阅读了不少文献,发现现有的方法基本都是离线的action recognition和action detection(离线指这些算法都是在处理切割好的视频片断)。而online action detection还没有很好的方法。以下给出我总结的动作检测/识别问题的分类及一些研究进展。
Action Recognition
- 目的:判断一个视频片断中某个动作是否发生
- 特点:简化了问题,一般使用的数据库都先将动作分割好了,一个视频片断中包含一段明确的动作,时间较短(几秒钟)且有唯一确定的label。所以也可以看作是输入为视频,输出为动作标签的多分类问题。此外,动作识别数据库中的动作一般都比较明确,周围的干扰也相对较少(不那么real-world)。
- Online/Offline:action recognition中的算法均为offline算法,此处并不是指训练过程的online还是offline,而是指测试过程。Action recognition的算法都是将一段视频整体作为输入,所以是offline的。
- 常用数据库
- 视频数据库:
- 来源:视频通常来自youtube,电视剧集,体育赛事视频等
- 常用:UCF50,UCF101,HMDB51等
- 视频数据库: