现实问题:随着社会的发展,城市人口的扩增,导致城市特定场所人口聚集度越来越大,不安全因素随之扩大。有效地估计特定场所的人口密度以及计算当前场景的人口数量对道道路安全和交通管理来说显得尤为重要。
解决来源(之一):WACV'18 paper - Crowd counting via scale-adaptive convolutional neural network (SaCNN)
文章原理就不过多介绍了,小伙伴可自行参考论文。最优之处博主认为采用了全卷积网络,可针对任意图像输入,不会造成图像失真。
博主复现了原论文,实验对比如下:
测试结果:
------------------------------------------------更新2018.3.20--------------------------------------------
添加了windows-c++测试代码(基于caffe)
测试硬件:CPU-i7-4790-4核
测试结果:512x384分辨率图像,耗时1.7s左右,内存消耗1.4G左右
注意:因为是全卷积网络,所以内存消耗和输入图像分辨率大小成正比,耗时也和输入图像分辨率大小成正比!
------------------------------------------------更新2019.4.20--------------------------------------------
基于MobileNet架构,优化人群密度估计
测试硬件:CPU-i7-9700K-6核
测试结果:
ShangHaiTech_PartB | CPU Speed (ms/frame) | |||
Evaluate | MAE | MSE | 1024x768 | 512x384 |
Zhang et al. | 26.4 | 41.3 | - | - |
SaCNN | 16.2 | 25.8 | 2300 | 590 |
MobileNet_V1 | 22.8 | 40.3 | 190 | 55 |
MobileNet_V2 | 27.3 | 50.6 | 100 | 35 |
任何问题请加唯一QQ2258205918(名称samylee)!
或唯一VX:samylee_csdn