近年来,安防监控在智慧城市中扮演的角色越来越重要,监控视角下的人群分析对于构建智慧城市的重要性日渐显现。
人群计数与定位作为其中的基础任务,服务于人流预测、城市规划、空间设计等高阶任务。
然而,该领域依然缺乏大规模的数据集以及公平的测试基准平台,尤其是人群定位依然没有一个有效的衡量标准。
为此,主要做了以下几项工作(对应论文已经被T-PAMI接收):
论文题目:
- NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization
论文地址:
https://ieeexplore.ieee.org/document/9153156
https://arxiv.org/abs/2001.03360
项目地址:
- https://gjy3035.github.io/NWPU-Crowd-Sample-Code/
构建了包含5,000余幅图像的人群计数/定位数据集NWPU-Crowd,并对其以人头点和人头框的方式进行标注;
搭建了线上测试平台,能够让研究者公平地参与测试集的评估;
更新了C3F人群计数框架,完美支持Python3并将密度图处理改为在线生成,节省存储;
公开了针对人群计数专门设计的标注工具,能够有效应对尺度变化、多标漏标的现象。
更多公开的内容参见项目主页,包含了论文的历史版本、公开的数据集、样例代码、标注工具、实验结果等。本文将从上述四个方面介绍该工作。
01
NWPU-Crowd数据集
数据获取
NWPU-Crowd数据集包含了5,109幅常见的人群图像,图像来源于Google, Baidu, Bing, Sougou等常用搜索引擎与pixbay, pxhere, wallhere等图片素材网站。以“人群、拥挤,春运,军训”等常见关键词进行检索收集,以求囊括多样化的人群场景。具体的搜索关键词如下表所示:
数据集特色
NWPU-Crowd有以下几个特色:
负样本。数据集中引入了351幅负样本图像,即无人场景。一些在纹理上与拥挤人群纹理相似的图像被收集进来,例如动物迁徙、花海、密集排列的图像,期望能够帮助模型提高泛化性能。
高分辨率图像。对于极端拥挤的超大人群场景,数据集搜集了高质量的、高分辨率的图像,其中最大尺寸达到了4028×19044。数据图像的平均分辨率为2191×3209。