论文笔记:Switching Convolutional Neural Network for Crowd Counting

本文介绍了一种名为Switch-CNN的卷积神经网络模型,用于解决密集人群计数问题。该模型通过多个不同卷积核大小的CNN回归器结合一个选择分类器,选择最佳回归器进行密度图预测,从而提高计数准确性。网络结构包括三个CNN回归器和一个基于VGG-16的选择分类器。训练过程包括预训练、差异训练和集成训练。在ShanghaiTech等数据集上,Switch-CNN展现了优秀的性能。
摘要由CSDN通过智能技术生成

Switching Convolutional Neural Network for Crowd Counting

概要

文章提出了一种人群计数模型,实现了从密集人群图像到其密度分布的映射。密集人群计数问题的难点包括人头互相遮盖、人群与背景相似度高以及图像拍摄视角各不相同等,此前效果较好的人群计数网络使用了多尺寸CNN、循环网络或多列CNN特征融合的方法来处理这些问题。作者提出了选择卷积神经网络switching convolutional neural network(Switch-CNN)来提升人群计数的精确度,首先由几个卷积核大小不同的CNN作为密度图预测的回归器,然后再由一个经训练的选择分类器来对于每一张输入图像选取最优的CNN回归器,将其结果作为最终结果。

网络结构

Switch-CNN包含三个结构互不相同的CNN回归器和一个选择最优回归器的分类器。对于每一张输入图片,首先将其裁剪为互不重叠的9份,每份为原图的1/3长宽。其目的是为了使输入的小图片可以视为拥有单一的密度、规模和视角信息,作为一个选择回归器的最小单位。

CNN回归器选择了CVPR2016《Single-Image Crowd Counting via Multi-Column Convolutional Neural Network》中的网络结构,每一列都包括4个卷积层和2个池化层,三列的卷积核大小各不相同。

分类器则使用了基于VGG-16的结构,移除了最后的全连接层,代之以一个全局平均池化层global avera

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值