Mixture of Counting CNNs: Adaptive Integration of CNNs Specialized to Specific Appearance for Crowd Counting
https://arxiv.org/abs/1703.09393
本文是人群计数的,不是人群密度估计。所以网络结构比较比较简单。这里主要的思路是针对不同场景的 scale and congestion 造成图像块的 Appearance 差别很大,这里我们使用多个小 CNN 来估计总人群。另外适应一个大点的 CNN 对 图像块进行分类,这种分类主要依据人群密度大小。类别的概率作为每个小 CNN 的权重。
Appearance 的差异性
我们提出的网络结构 Mixture of Counting CNNs
3.1. Counting by MoC-CNN
网络最终的人数估计等于所有所有小CNN的人数估计权重之和。 weighed sum of output of each expert CNN
Architecture of gating and expert CNNs
这里我们认为分类的问题要更负责一些,所以对 gating CNN 我们使用了一个更大点的 CNN
我们对比测试了另外两种网络结构:
UCF CC 50 dataset
Mall dataset