人群密度估计--Crowd Counting Via Scale-adaptive Convolutional Nerual Network

Crowd Counting Via Scale-adaptive Convolutional Nerual Network
https://arxiv.org/abs/1711.04433v2
Code: https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu

为了解决人群密度估计中的 scale and perspective 问题,先前研究者提出使用 多尺度卷积网络来解决多尺度问题
Multiple columns have different receptive fields corresponding to pedestrians (heads) of different scales
这里我们提出一个 尺度自适应CNN网络,只使用 3 ∗ 3 滤波器,结合CNN网络不同网络层的特征
a scale-adaptive CNN (SaCNN) architecture with a backbone of fixed small receptive fields.
We use all 3 ∗ 3 filters in the network

输入输出图示
这里写图片描述

3 Scale-adaptive CNN
3.1. Ground truth density maps
每个人头我们使用一个 delta function 来表示,ground truth density map D(x) 由 delta function 和 一个 Gaussian kernel 卷积得到
这里写图片描述
N 表示图像中人头总数,
The sum of the density map is equivalent to the total number of pedestrians in a crowd

3.2. Network architecture
这里写图片描述

这里写图片描述

The final density map therefore has a spatial resolution of 1/8 times of the input image.

3.3. Network loss
Euclidean loss to measure the distance between the estimated density map and the ground truth
这里写图片描述

引入了一个新的损失函数,侧重于 解决图像中只有几个人的情况估计效果不好的问题
introduce another loss function regarding the head count
We notice that most representative approaches perform poorly on crowd scenes with few pedestrians.
原来的损失函数不能解决这个问题的原因:because the absolute pedestrian number is usually not very large in sparse crowds compared to that in dense crowds
这里写图片描述

4 Experiments
这里写图片描述

我们的新数据库:特点 人少
这里写图片描述

ShanghaiTech dataset
这里写图片描述

这里写图片描述

这里写图片描述

WorldExpo’10 dataset & UCF CC 50 dataset
这里写图片描述

SmartCity dataset
这里写图片描述

这里写图片描述

下面是和 YOLO9000 对比,各有所长
这里写图片描述

这里写图片描述

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值