Boosting Crowd Counting via Multifaceted Attention

Yunpeng1119

已于 2022-09-16 14:57:21 修改

阅读量946

点赞数

分类专栏： Crowd density estimation 文章标签： transformer

于 2022-09-16 11:14:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shaomjc/article/details/126886791

版权

MAN是一种新型网络，结合全局、局部可学习区域和实例注意力，解决尺度差异和标签噪声问题。LRA动态分配注意力范围，LAR确保注意力与人头大小对应，IAL处理标注错误。实验显示MAN提高了人群计数的精度。

摘要由CSDN通过智能技术生成

MAN(人群计数)

提出问题：

同一张图片中由于远近关系人头大小可能差异很大，但是标签只有点标注，目前 CNN 和全局 Attention 是没法很好应对这种尺度差异的；

有些标签位置不太准确，比如应该在人头正中心却标注的有些偏。

因此文章一共提出了三个模块，可学习区域注意力（LRA）、局部注意力正则化（LAR）和实例注意力损失。前两个彼此关联，致力于解决第一个尺度差异问题；最后一个则是针对标签噪声，提出了非常简单却可以推广的损失范式。

解决方法：

提出了一种多方面注意网络（MAN）

最低0.47元/天解锁文章

关注

0
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。