crowd counting_[crowd_counting]-DUB-CSRNet-arxiv1903

ebe3bf17f205aa3ced24521d29dd488d.png

6e4aa3e9ac59b2bc76d7f21fc8db6a6b.png

1.Contribution

这是一篇我看到现在为数不多的通过统计学思想来做counting的,看的有些难受,感觉需要回去复习数理统计的知识了,本文的motivation就是不确定性度量,就是认为只输出一个density map存在不确定性,使得模型变成多输出,然后取平均,会降低不确定性,所谓DUB是指Decomposed uncertainty using bootstrap

2.Uncertainty estimation

(1)不确定性种类

本文提出了传统单输出的方法存在两种不确定性:

①epistemic uncertainty

主要是指模型本身的不确定性,也就是说假如模型预测一个点的密度为0.7,那么由于不确定性的存在,这个点可能预测为0,0.5~0.8的区间,存在一个波动,

②aleatoric uncertainty

主要指数据本身存在的不确定性,比如一张图片,由于遮挡,有些地方看着又像一个人,又像2个人

(2)如何度量不确定性

文章描述了传统度量不确定性的两种方法

①Bayesian neural network

a5cc85e87afdc22209aeb95e519c326b.png

这里涉及到大量统计学的背景知识,不多展开,文中提到这种方法的弊端在于计算复杂度很高

②Bootstrap ensemble

核心思想是将原始数据集采样成K个自数据集,才每个数据集上训练结构相同的模型,得到K个模型

然后进行预测时,随机选择一个模型的预测结果

这相当于认为模型参数也服从一定分布,然后我们对分布进行随机采样了

06e207f1a0ea48906a350fea8c58f928.png

但是由于要训练K个模型,且每次预测时,K个模型都要跑,所以计算代价比较大,文中也采用Bootstrap ensemble的思想,但是不去训练独立的K个模型,而是采用前端共享一个backbone,然后输出K个head的方式

3.模型结构

6687ced20fe0e7132d43e4ac1799a4bd.png

(1)很明显,模型结构前端用了CSRnet的结构,后面加上了K个head,去预测K个density ,map,同时预测不确定性σ2

(2)训练方法

设置K=10,Adam with lr=1e-5,ground truth采用的是geometry adaptive kernel,训练方法如下:

515c4c7471bee687bc875232bd6ed0e6.png

就是每次随机选择K个输出之一去作为预测值,结合不确定性Sn去计算loss

(3)test方法

test时,要取K个输出的平均作为输出,同时统计方法

5bfc7de48cdedc43a60c4ff72feed201.png

E(y)代表均值

198cf415b3b652492351a1c4bacd3599.png

4.Experiment

(1)ablation study

bced9865f1a3574742461fa1749461df.png

Epistemic only应该指的是采用K个输出,但是不预测不确定性σ2,为了计算loss,σ2采用了固定值,但是也没说是多少,loss如下:

f013b0f0f9f2518030f355c5c08b40d0.png

Aleatoric only指的不采用K个输出,只输出一个density map,和误差预测σ2分支:

15d96480ca434a645abaf29c8a85c57f.png

以下是density map预测结果和不确定性预测结果:

ec963a181bd6157a40221641874592ee.png

我还是不是很明白,这里的Epistemic Uncertainty是怎么算出来的,是指多个输出之间的方差吗?

(2)公开数据集

①ShanghaiTech

ee97aae44e0eed112fbf217363771bf8.png

②UCSD

178dbb24429c743d429d39c74552c032.png

③UCF_CC_50

03729547aeab119dd7b910395beca58e.png

④UCF-QNRF

8b4c963dbdebcae759ee098e4346a1f3.png

5.comment

本文最主要的贡献就是通过多输出取平均,以及加上不确定性度量的map去规避一些不确定性因素的影响,最后对网络效果有一些略微的提升,不过多输出取平均的思想或许可以借鉴

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值