Boosting Crowd Counting via Multifaceted Attention

MAN是一种新型网络,结合全局、局部可学习区域和实例注意力,解决尺度差异和标签噪声问题。LRA动态分配注意力范围,LAR确保注意力与人头大小对应,IAL处理标注错误。实验显示MAN提高了人群计数的精度。
摘要由CSDN通过智能技术生成

MAN(人群计数)

提出问题:

同一张图片中由于远近关系人头大小可能差异很大,但是标签只有点标注,目前 CNN 和 全局 Attention 是没法很好应对这种尺度差异的;

有些标签位置不太准确,比如应该在人头正中心却标注的有些偏。

因此文章一共提出了三个模块,可学习区域注意力(LRA)局部注意力正则化(LAR)实例注意力损失前两个彼此关联,致力于解决第一个尺度差异问题;最后一个则是针对标签噪声,提出了非常简单却可以推广的损失范式。

解决方法:

提出了一种多方面注意网络(MAN)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值