无人机低空视角:针对人群密集场景的检测、跟踪和计数技术
本文提出了一种时空多尺度注意力网络(STANet),用于解决由无人机捕捉的视频剪辑中的密集人群的密度图估计、定位和跟踪问题,涵盖了各种人群密度、视角和飞行高度。我们的STANet方法通过聚合顺序帧中的多尺度特征图来利用时间一致性,然后同时预测密度图、定位目标并在人群中关联它们。我们设计了一个由密度图损失、定位损失和关联损失三个项组成的多任务损失函数,并采用逐步应用注意力模块的粗到细过程,以强化网络对判别性时空特征的利用,以提高性能。整个网络以端到端的方式进行训练。
原创
2024-01-03 09:29:28 ·
1706 阅读 ·
0 评论