「AI Drive」是由 biendata 和 PaperWeekly 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到西安交通大学网络空间安全学院一年级硕士生-林卉,为大家在线解读其发表在CVPR 2022的最新研究成果:基于多面注意力机制的人群计数。对本期主题感兴趣的小伙伴,5月 24日(周二)晚 7 点,我们准时相约 AI_Drive B 站直播间。
一、直播信息
1、演讲摘要:
本次讲座将主要汇报我们CVPR 2022 的一篇文章。该文主要针对人群计数任务的两个难点:首先,密集人群图像中由于远近关系人头大小差异很大;其次,部分提供的标签由于标注误差等原因不在人头正中心位置,因此存在噪声。为此,本文提出了三个模块:
1)Transformer 中可学习的区域注意力机制,实现动态地为每个特征分配注意力;
2)与其配套的局部注意力正则化,通过最小化不同特征位置的注意力偏差来监督变形器网络的训练,解决尺度差异问题;
3)实例注意力损失,可在训练期间动态地关注最重要的实例,