人群密度估计--Structured Inhomogeneous Density Map Learning for Crowd Counting

Structured Inhomogeneous Density Map Learning for Crowd Counting
https://arxiv.org/abs/1801.06642

针对人群密度估计问题,本文分析了当前基于密度估计问题算法存在的问题, inhomogeneous density distribution problem,随后提出解决这个问题的方法,将密度图由2D 拓展到 3D,网络具体实现由 Density-Aware Network

这里写图片描述

当前基于密度图估计算法主要网络结构有以下几种:

这里写图片描述

A. Problem Formulation
这问题的描述中介绍了人群密度估计问题是如何由标记图像变为人群密度图,以及将密度估计问题变为回归问题,设计损失函数

B. The Inhomogeneous Density Distribution
根据以前的研究结论,我们观察到三个有意思的现象:
a) local model 的性能比 global model 的性能要好,这个结论是从分析 Switch-CNN [2] 和 MCNN [28] 这两个网络结构得出的。Switch-CNN 和 MCNN 整体网络结构基本一样,Switch-CNN 自动选择一个 column 来做预测,而 MCNN 融合三个 column 得到一个 global regressor。Switch-CNN 和 MCNN 两个网络,哪个性能更好了? 对此文献数据就可以知道了
b) DNNs 相对于 shallow networks 表现的更差,尤其是在 人群密度差异较大的数据库上( especially on datasets with various density levels)
c) 当前方法的 mean absolute error (MAE) 和 数据的密度差异成正比, is proportional to the relative density level
也就是说增加网络的深度 不能帮助我们解决问题,为什么会这样了?
主要是图像中的 inhomogeneous density distribution 导致这个问题的。

接着我们深入分析了这个 inhomogeneous density distribution 具体形式以及现实中为什么会出现这个问题

接着我们用这个 inhomogeneous density distribution 解释了上面三个现象。

接着我们指出了三个可能存在的问题:Dying ReLU;Exploding Gradients;Saddle Points

Density-Aware Network (DAN)
这里写图片描述

A. Separating Inhomogeneous Density Distribution as Structured Learning
我们解决这个 inhomogeneous density distribution 方法也很简单: extend the 2D density maps to the structured density maps (3D),第三维度我们表示 density levels,每个等级使用一个 独立的 Gaussian kernel
这里写图片描述

网络主要修改的地方:
这里写图片描述

常用数据库一些统计指标:
这里写图片描述

实验对比效果:
这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值