干货!面向人群计数的跨模态协作表征学习方法和大规模RBGT数据集

点击蓝字

a1d8883f7b51a121e6664fa34a7bbc09.png

关注我们

AI TIME欢迎每一位AI爱好者的加入!

人群计数是一项基本但又十分具有挑战性的视觉任务,它需要丰富的信息来生成像素级别的人群密度图。之前的方法大多数仅使有限的用光学图像信息,在不受控场景下无法很好地发撅潜在的行人。在这项工作中,我们发现,融合光学信息和热感信息可以极大地提升人群计数性能。为了促进该领域未来的科学研究,我们首创地引入了一个大型RGBT人群计数(RGBT-CC)基准,该基准包含2030对光学/热感图像,总共标注了138389位行人。为了进一步促进多模式人群计数的研究,我们提出了一种跨模态协同表征学习框架,该框架由多个模态特异分支,一个模态共享分支以及一个信息聚合分散模块(IADM)组成,以充分捕捉不同模在数据的互补性。具体来说,我们的IADM由两个协同信息传递器组成,通过对偶信息传播机制动态地增强模态共享表征和模态特异分支表征。在RBET-CC数据集上进行的大量实验充分地验证了我们框架对RGBT人群计数的有效性。此外,我们的方法RGBD人群计数任务上也取得了业内领先的性能。

本期AI Time PhD 直播间,我们邀请到中山大学博士,香港理工大学博士后刘凌波带来分享——《Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Crowd Counting》

98cbb307064b74e8efec0db1cd990b87.png

中山大学博士,香港理工大学博士后,悉尼大学访问学者。主要研究兴趣是城市计算,特别是面向交通出行场景的城市路网提取、人群计数、流量/需求预测、个性化推荐和订单分配等任务;在CVPR,ICCV,IJCAI,ACM MM,TITS,TNNLS,TMM等国际顶级刊物上发表论文15篇。

个人主页: http://lingboliu.com/。

01

 背  景 

给定一张图片,返回图片中的人数,这样

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值