Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Crowd Countin

最新推荐文章于 2024-04-07 17:08:47 发布

飞天小女侠~

最新推荐文章于 2024-04-07 17:08:47 发布

阅读量815

点赞数

分类专栏：论文阅读文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuan971130/article/details/118025474

版权

Accepted by CVPR2021

Lingbo Liu1, Jiaqi Chen1, Hefeng Wu1, Guanbin Li1,2, Chenglong Li3, Liang Lin1,4*

研究领域：RGBT行人计数

目录

1.摘要和引言

2.2协作表示学习

2.2.1 上下文信息提取

2.2.2 信息聚合传输（IAT）

2.2.3信息分布传输（IDT）

1.摘要和引言

提出了一种跨模态协同表示学习框架，包含多个模态特定分支，一个模态共享分支以及一个信息聚合分布模块（IADM Information Aggregation-Distribution Module）来捕获不同模态的互补信息。确切地说，IADM包含两个协作信息传输，来动态地增强具有双重信息传播机制的模式共享和特定于模式的表示，确切地说：（1）动态聚合所有模态特定特性的上下文信息以增强模态共享特性的信息聚合传输。（2）传播模态共享信息，以对称地细化每个模态特定的特征，来进一步进行表示学习的信息分布传输。此外，将IADM嵌入到不同的层中，来分层学习跨模态表示。

本文提出的方法具有三个吸引人的特性：

（1）由于双重信息传播机制，IADM可以有效捕获多模态互补信息方便人群计数。

（2）作为一个即插即用的模块，IADM可以很容易地整合到各种骨干网络中进行端到端优化。

（2）该框架对于多模态行人计数是通用的。除了RGBT计数，提出的方法可以轻松应用到RGBD计数。

本文主要贡献有以下三点：

为促进人群计数研究，引入一个大规模的RGBT基准，在无约束场景下采集的2030对RGB-热红外

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。