SiamAPN++: Siamese Attentional Aggregation Network for Real-Time UAV Tracking
paperwithcode:https://www.paperswithcode.com/paper/siamapn-siamese-attentional-aggregation
论文:https://arxiv.org/pdf/2106.08816v1.pdf
代码:https://github.com/vision4robotics/SiamAPN
1.文章背景及创新:
- 在无人机目标根踪领域,大多数现有的基于暹罗的跟踪器很难将优越的性能与高效率结合起来,(SiamAPN++)是针对无人机实时跟踪而提出的。
- 文章利用注意机制,通过Self-AAN和Cross-AAN进行注意聚合网络(Attention Aggregation Network, AAN),最终提高特征的表达能力。
- Self-AAN通过空间维度和通道维度聚合和建模单个特征地图的自语义相互依赖。
- Cross-AAN旨在聚合包括锚点位置信息在内的不同语义特征之间的相互依赖关系。
- 此外,文章提出了双特征版本的锚提议网络,以提高提出锚的鲁棒性,提高对不同尺度目标的感知能力。
- 文章在两个著名的权威基准上进行了实验,其中SiamAPN++优于其基准SiamAPN和其他SOTA跟踪器。此外,在一个典型的嵌入式平台上进行的实际测试表明,SiamAPN++在实时速度上实现了很好的跟踪结果。
图1
2.文章结构
图2 文中结构
图3 代码中的整体结构
从图3中可看出Self-ANN实际上参考了自注意力网咯中的{K,Q,V}结构(这里实际上为Self-ANN中空间注意力的一部分),图2中又可看出Self-ANN中的空间注意力和通道注意力,都采用一种残差结构。两张图一对比,又能看出实际上APN-DF结构本质上是Cross-ANN结构。
对于分类网络,文中采用三个子分支的分类网络,与传统目标跟踪网络表示一样,表示前景和背景,其中有一分支只表示前景。
3.损失函数
- 回归损失:
其中α是一个超参数,反映了对正样本和负样本的倾斜度 ,其取值范围是1到2
分类损失:
分类损失与传统跟踪网络一样,为交叉熵损失。