密集人群检测与计数survey

1.人群计数的方法主要分为四类:detection-based, regression-based, density estimation, 和CNN-based density 的预测方法。

2 人群计数的代表性网络结构

回顾不同类型的网络结构,我们将人群计数模型分为三类:基于CNN的基本方法,基于多列的方法和基于单列的方法。

Basic CNN:该网络架构采用卷积层,池化层,全连接层等基本CNN层,而无需其他功能信息。这主要是将CNN用于密度估计和人群计数的初始方法。

Multi-column:这些网络架构通常采用不同的列来捕获对应于不同接受域的多尺度信息,从而为人群计数带来了较好的性能。

Single column:单列网络体系结构通常部署单个和更深的CNN,而不是多列网络体系结构的膨胀结构,并且前提是不增加网络的复杂性。

方法的学习范式

Single-task based methods:经典的方法是单任务学习[111]。 大多数基于CNN的人群计数方法都属于该范例,通常会生成密度图,然后将所有像素相加以获得总计数数或直接获得计数数。
Multi-task based methods:它通过结合密度估计和其他任务(例如分类,检测,分割等)而具有更好的性能。基于多任务的方法通常设计有多个子网。 此外,与纯单列架构相比,可能存在其他对应于不同任务的分支。综上所述,多任务体系结构可以看作是多列和单列之间的交叉融合,但两者都不相同。

Inference manner(推论方式)

Patch-based methods:训练时随机裁取图片patch进行训练,测试时,使用滑动窗口遍历整个测试图像,并获得每个窗口的估计值,然后将它们组合起来以获得图像的最终总数。

Whole image-based methods:基于补丁的方法总是忽略全局信息,并且由于滑动窗口操作而负担很多计算成本。因此,基于整体图像的方法通常以整体图像为输入,并输出相应的密度图或人群总数,虽然收敛性更高,但有时可能会丢失局部信息。

监督形式

根据是否使用人工标注的注释,人群计数方法可分为两类:完全监督方法非/自我/半监督方法

Domain adaptation

几乎所有现有的计数方法都是在特定领域中设计的; 因此,设计一个可以对任何对象域进行计数的计数模型是一项艰巨而有意义的任务。 域自适应技术可能是解决此问题的强大工具。

Instance-/image-based supervision

人群计数的目标是对象计数,如果ground truth是对象的点或者边界框则为instance-level的监督,相反,如果只是一个数字,则为Image-level的监督。

3.重复性的操作十分烦琐,尤其是在处理多个彼此关联对象情况下,此时我们可以使用级联(Cascade)操作。级联 在关联映射中是个重要的概念,指当主动方对象执行操作时,被关联对象(被动方)是否同步执行同一操作。

级联还指用来设计一对多关系。例如一个表存放老师的信息:表A(姓名,性别,年龄),姓名为主键。还有一张表存放老师所教的班级信息:表B(姓名,班级)。他们通过姓名来级联。级联的操作有级联更新,级联删除。 在启用一个级联更新选项后,就可在存在相匹配的外键值的前提下更改一个主键值。系统会相应地更新所有匹配的外键值。如果在表A中将姓名为张三的记录改为李四,那么表B中的姓名为张三的所有记录也会随着改为李四。级联删除与更新相类似。如果在表A中将姓名为张三的记录删除,那么表B中的姓名为张三的所有记录也将删除。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值