西工大开源拥挤人群数据集生成工具,大幅提升算法精度 | CVPR 2019

640?wx_fmt=jpeg


作者 | 周强(CV君)

转载自 我爱计算机视觉(公众号id:aicvml)


近年来,因为拥挤人群计数在视频监控、公共安全方面的应用广泛,引起了不少学者的关注。


简单说来这个任务就是给定图像,返回该图像所描述场景中有多少人。


这可以帮助城市管理者、大型活动组织方实时了解人群拥挤情况,以利于早期防范群体事件、人群踩踏等。


和大多数计算机视觉任务面临相同的困境,视频数据容易获取,但标注却是个耗费大量人力物力的工作。


今天新上传到 arXiv 的 CVPR 2019 的接收论文《Learning from Synthetic Data for Crowd Counting in the Wild》,来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法,并开源了他们创建的大型数据集,在此数据集上训练的算法精度获得了大幅提升,超越了之前的state-of-the-art。


作者信息:


640?wx_fmt=jpeg


作者全部来自西北工业大学。


作者使用计算机图形学的方法,通过设置不同的多样化的场景、设置不同的人物模型,创建了大量的样本数据。


640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg


下图是与现有数据集的比较,可见该论文中提出的GCC数据集是目前最大的公开数据集。


640?wx_fmt=jpeg


同时,该数据集在每幅图像中行人个数、时间分布、天气情况分布各个方面也具有多样性,非常适合人群计数任务。


640?wx_fmt=jpeg


如何用这个数据集?


该数据集是合成数据集,作者提出两种方法,使用该数据集参与算法训练。


如下图,上面部分为监督学习方法,下面部分为使用域适应的方法。


640?wx_fmt=jpeg


一种是监督学习的方法,使用该大型数据集预训练网络,再在实际的真实场景数据集中微调网络。


使用这种方法,作者采用的网络模型:


640?wx_fmt=jpeg


获得了超越目前该任务state-of-the-art的精度。


640?wx_fmt=jpeg

640?wx_fmt=jpeg


使用域适应方法的算法流程图:


640?wx_fmt=jpeg


使用该数据集后,算法同样获得了大幅的精度提升。


640?wx_fmt=jpeg


作者已经公开了该数据集,并开源了数据创建标注工具。

https://github.com/gjy3035/GCC-CL

项目主页:

https://gjy3035.github.io/GCC-CL/

论文地址:

https://arxiv.org/pdf/1903.03303.pdf


感谢各位作者!


下面来看看作者放出的数据创建Demo视频:



对于做相关方法的朋友,非常值得参考!


(本文为 AI科技大本营转载文章,转载请联系原作者


在线分享会

周五晚8点

拿下斯坦福和剑桥双offer,00后的算法学习之路


640?wx_fmt=png

推荐阅读:

                         640?wx_fmt=png

❤点击“阅读原文”,查看历史精彩文章。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值