西工大开源拥挤人群数据集生成工具，大幅提升算法精度 | CVPR 2019

最新推荐文章于 2024-04-18 10:03:51 发布

AI科技大本营

最新推荐文章于 2024-04-18 10:03:51 发布

阅读量1.9k

点赞数 1

640?wx_fmt=jpeg

作者 | 周强（CV君）

转载自我爱计算机视觉（公众号id：aicvml）

近年来，因为拥挤人群计数在视频监控、公共安全方面的应用广泛，引起了不少学者的关注。

简单说来这个任务就是给定图像，返回该图像所描述场景中有多少人。

这可以帮助城市管理者、大型活动组织方实时了解人群拥挤情况，以利于早期防范群体事件、人群踩踏等。

和大多数计算机视觉任务面临相同的困境，视频数据容易获取，但标注却是个耗费大量人力物力的工作。

今天新上传到 arXiv 的 CVPR 2019 的接收论文《Learning from Synthetic Data for Crowd Counting in the Wild》，来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法，并开源了他们创建的大型数据集，在此数据集上训练的算法精度获得了大幅提升，超越了之前的state-of-the-art。

作者信息：

640?wx_fmt=jpeg

作者全部来自西北工业大学。

作者使用计算机图形学的方法，通过设置不同的多样化的场景、设置不同的人物模型，创建了大量的样本数据。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

下图是与现有数据集的比较，可见该论文中提出的GCC数据集是目前最大的公开数据集。

640?wx_fmt=jpeg

同时，该数据集在每幅图像中行人个数、时间分布、天气情况分布各个方面也具有多样性，非常适合人群计数任务。

640?wx_fmt=jpeg

如何用这个数据集？

该数据集是合成数据集，作者提出两种方法，使用该数据集参与算法训练。

如下图，上面部分为监督学习方法，下面部分为使用域适应的方法。

640?wx_fmt=jpeg

一种是监督学习的方法，使用该大型数据集预训练网络，再在实际的真实场景数据集中微调网络。

使用这种方法，作者采用的网络模型：

640?wx_fmt=jpeg

获得了超越目前该任务state-of-the-art的精度。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

使用域适应方法的算法流程图：

640?wx_fmt=jpeg

使用该数据集后，算法同样获得了大幅的精度提升。

640?wx_fmt=jpeg

作者已经公开了该数据集，并开源了数据创建标注工具。

https://github.com/gjy3035/GCC-CL

项目主页：

https://gjy3035.github.io/GCC-CL/

论文地址：

https://arxiv.org/pdf/1903.03303.pdf

感谢各位作者！

下面来看看作者放出的数据创建Demo视频：

对于做相关方法的朋友，非常值得参考！

（本文为 AI科技大本营转载文章，转载请联系原作者）

在线分享会

◆

周五晚8点

◆

拿下斯坦福和剑桥双offer，00后的算法学习之路

640?wx_fmt=png

推荐阅读：

640?wx_fmt=png

❤点击“阅读原文”，查看历史精彩文章。

AI科技大本营

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
西工大开源拥挤人群数据集生成工具，大幅提升算法精度 | CVPR 2019

作者 | 周强（CV君）转载自我爱计算机视觉（公众号id：aicvml）Python规划学习路线图，速领取？https://edu.csdn.net/topic/python115?utm_source=csdn_bw近年来，因为拥挤人群计数在视频监控、公共安全方面的应用广泛，引起了不少学者的关注。简单说来这个任务就是给定图像，返回该图像所描述场景中...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。