参考文献:Dollar P, Wojek C, Schiele B, et al. Pedestrian detection: A benchmark[J]. Proc Cvpr, 2009:304-311.
论文的主要贡献:
1. 介绍了Caltech行人检测数据集(Caltech Pedestrian Dataset);
2. 提出了更好的行人检测算法评价标准;
3. 在新数据集上对7个现有算法进行了评测;
4. 陈述了当前算在数据集上准确率不高的原因,给出了未来的研究方向。
Caltech行人检测数据集:
该数据集收集了城市中正常交通状态下大约10小时30Hz的行车记录,视频分辨率为640x480。通过标记其中的250,000帧获得了总计350,000个boundingbox (BB),其中包含行人的BB有2300个。数据拍摄于洛杉矶周边的5个场景,分为11个片段,将所有数据粗略的划分为两个部分分别组作为训练集和测试集,其中0-5作为训练集、6-10作为测试集。
人工标注及人工分类:
对于每帧中可以看到的行人,使用一个BB来标记行人的全部信息;
对于每帧中被部分遮挡的行人,使用一个BB来标记其可见部分,并使用另一个BB标记其全部信息(包括预测的 遮挡部分)。
所有的BB被分为3类:独立行人(person,~1900),一群人(people,~300),难以分辨的行人(person?,&#x