论文笔记:A survey of recent advances in CNN-based single image crowd counting and density estimation

A survey of recent advances in CNN-based single image crowd counting and density estimation

目标

人群计数目标是计算一个密集场景下的人数,密度估计目标是将人群图像转换成密度图像,可以清晰地看出人群的分布。这两个问题已经被结合在一起。

传统方法

  • 基于检测的方法
  • 基于回归的方法
  • 基于密度估计的方法

基于CNN的方法

对网络特性的分类:

  • 基础CNN
  • 规模感知模型
  • 上下文感知模型
  • 多任务模型

对输入数据的分类:

  • 基于块的方法
  • 基于完整图像的方法

具体方法

Deep people counting in extremely dense crowds

基础CNN,基于块
端到端的深度CNN回归模型,使用了AlexNet,将最后的全连接层的4096的神经元改成了一个单一神经元用于预测人数。

Fast crowd density estimation with convolutional neural networks

基础CNN,基于块
将图像分为密度从高到低的五类,使用了Multi-stage ConvNet。使用了两个串联的分类器来提高效果。

Cross-scene crowd counting via deep convolutional neural networks

多任务模型,基于块
提出学习图像到人数的映射,并在应用到新场景时使用符合场景的图像微调。训练时可选地训练以人数和密度估计为目标训练。

Learning to count with CNN boosting

基础CNN,基于块
提出layered boosting和selective sampling方法。

End-to-end crowd counting via joint learning local and global count

上下文感知模型,基于完整图像
直接接收整张图像作为输入,输出人数。组成部分:预训练的GoogLeNet,LSTM解码器和最后的全连接层。

Crowdnet: a deep convolutional network for dense crowd counting

上下文感知模型,基于块
混合了深层和浅层全连接网络来预测密度图像,两种网络的组合可以有效减小视角偏差的影响。

Single-image crowd counting via multi-column convolutional neural network

规模感知模型,基于完整图像
提出多列卷积模型MCNN,可用于任意密度和任意视角。同时使用了一种新的生成密度图像的方法,并公布了数据集ShanghaiTech。

Towards perspective-free object counting with deep learning

规模感知模型,基于完整图像
提出HydraCNN,第一部分为多个CountingCNN,第二部分为全连接层,可以有效学习不同场景下的特征。

Switching convolutional neural network for crowd counting

规模感知模型,基于块

在多列CNN的基础上加入一个基于VGG-16的选择器,选取最优的列。

Mixture of counting CNNs: adaptive integration of cnns specialized to specific appearance for crowd counting

规模感知模型,基于块

使用多个expertCNN预测人数,和一个gatingCNN来给所有expertCNN设置权重。

Fully convolutional crowd counting on highly congested scenes

规模感知模型,基于完整图像

仅使用一列CNN,预测时对不同规模的输出结果取平均值。

数据集

  • UCSD
  • Mall
  • UCF_CC_50
  • WorldExpo’10
  • ShanghaiTech

发布了48 篇原创文章 · 获赞 6 · 访问量 2万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览