最近在做人群密度估计,是一种以密度图的形式表示人群密集程度的方法,大概如下图
左图是某公共场所的人群图,右图是人群密度图,也就是用来训练生成人群密度图网络的标签。首先要将原图中左右人头的坐标标定出来,然后生成密度图像。
原理
如果一个标注点的位置为
,我们可以将它表示为
,因此有
个人头的标签可以表示为:
我们可以使用高斯核
对这个函数卷积得到密度函数
。然而这是假设每个
在样本空间中是独立的。实际上,每个
是3D场景中的人群密度样本,由于透视失真,像素与周边样本在不同场景区域尺度不一致。
因此为了精确估计群体密度
需要考虑透视变换,我们需要考虑真实和图像的失真。通常我们不能确定场景的几乎形状。但是,如果我们每个头部周围的人群是均匀分布的,那么头部与最近k个邻居之间的图像中的平均距离可以给出几何失真的合理估计。
因此,我们应该根据图像中每个人头部大小来确定参数
,但是在实际情况下,由于遮挡,不可能准确的获得头部的尺寸,而且很难找到头部尺寸和密度图之间的关系。我们发现头部大小通常与拥挤场景中两个头部中心距离有关,所以我们使用相邻头部的平均距离作为参数。
对于每个人头
,给出
个近邻头部距离
的平均值
,
相关的像素对应场景中地面上的一个区域,这个区域的半径与
成正比。因此,为了估计像素