- 使用的方法
- 使用了一个U-net的生成网络来设计生成密度图;
- 采用了一种对抗损失,将solution 映射到真实子空间内,从而减少了密度图估计的模糊效果;
- 另外,设计了一种新的一种,一致性调节方式,使得人群的总和,可以从小的图片中计算出来,再和全局图片来对比,使得数量一致;
- 最后这里是通过联合训练,通过两者的合作来提高密度估计性能。
- 以往的缺点:
以往的人群记数是通过不同的卷积核来衡量大小
- 因此只有L2范数来优化模型;
- 对离群值和图像的敏感性不足,图像过于模糊;
- 而且,不同的卷积子网络之间没有协助,只是试图最小化自己的估计,导致在其他的尺度上性能不好,没有追求尺度的一致性问题;
- 此外,卷积核为滑动窗口设计,所以局部补丁的丢失,会影响全局。
- 本文提出的创新:
- 根据GANs在图像翻译上的思想,提出了一种对抗性损失,代替传统的L2范数损失,用于减轻optimization的模糊效应;
- 利用U-net 的多尺度架构,从而对于图像进行像素级翻译,即:一个像素点到密度图的像素点的映射。
- 提出了一种新的正则化器,用于校准跨尺度模型,并鼓励不同尺度的协同训练
- 使用两个互补密度图生成器,一个是大图像的输入,一个是将大图像切割后的小图像,通过大图像的记数=切割小图像记数的和&#
《Crowd Counting via Adversarial Cross-Scale Consistency Pursuit》解读
最新推荐文章于 2024-04-02 14:39:59 发布