crowd counting
github上有个该领域的论文代码整理 Awesome-Crowd-Counting
问题定义
其实就是个很简单的应用,在一张图片中计算人群数量。用于安防、人流控制等应用:
数据集
数据集来源于上海科技大学论文Convolutional Neural Network(MCNN)中的ShanghaiTech
技术细节
Ground-Truth Density Maps Generation
GT的生成同样借鉴自 Convolutional Neural Network(MCNN)
由于镜头视角会带来一些失真,以及人群之间不是相互独立的。将冲击函数形式的标签,乘上一个统一而固定的高斯核分布,是不准确的。
我们希望的是,依据头部大小来确定高斯分布的范围,即参数sigma的大小(
3
σ
3\sigma
3σ准则,将头部区域都囊括进来)。
然而头部大小很难估算,有意思的是,可以通过人头部之间的距离估算头部尺寸,从而得到最合适的高斯分布参数sigma:
于是得到如下公式:
在后续论文中,一般取三个最邻近的平均距离,再乘以系数
β
=
0.3
\beta=0.3
β=0.3,作为
σ
\sigma
σ,并且对于每个人头,归一化到整数1
比如凌波师兄的Crowd Counting with Deep Structured Scale Integration Network