前言
最近确定了crowd video classification的课题方向,这方面的文章不是很多,用深度学习做的更少,基本每篇此task的文章都会用到CUHK(香港中文大学做的人群视频数据集)和UCF101(activity recognition)两个数据集进行实验,这两个课题有很多的相似之处,比如:1、都是视频 2、分类的标准都利用动作走向 ,因此阅读论文时更多的情况居然都是在阅读activity recognition的论文。
这篇论文是极少数以crowd video recognition命名的,而且还用到了非常“时髦“的lstm以及attention-based模型,非常值得仔细阅读,因此在此精读此篇文章。
本篇文章选自2016年NIPS(Hea-Yong Kang, Soon-Seo Park, Seon Choi)