论文笔记VITAL: VIsual Tracking via Adversarial Learning
1. 论文标题及来源
VITAL: VIsual Tracking via Adversarial Learning, CVPR, 2018
下载地址:https://openaccess.thecvf.com/content_cvpr_2018/papers/Song_VITAL_VIsual_Tracking_CVPR_2018_paper.pdf
2. 拟解决问题
a. 正样本在空间上高度重叠
b. 正负样本不平衡
3. 解决方法
3.1 算法流程
网络结构如上图所示,它的流程如下
a. 通过卷积网络提取模板和搜索区域的特征
b. 利用gan网络的思想生成权重掩码,丰富模板特征的多样性
c. 将预测的权重掩码作为卷积核,与搜索预期的特征进行相关操作(类似于相关滤波系列的方法)
d. 最后连接两个全连层进行分类和回归
值得注意的是,在训练的时候,G(生成器)和D(判别器)都会保留;在测试的时候,只保留D(判别器)
4. 实验结果
4.1 OTB2013
4.2 OTB2015
4.3 VOT2016
5. 总结
该论文将gan网络的思想引入目标跟踪,通过gan网络丰富模板的特征,使其不过于关注某一帧的特征,从而提升鲁棒性,在OTB数据集上取得了不错的效果(OTB2013: AUC-0.710, Prec-0.95, OTB2015: AUC-0.691, Prec-0.917),但是在VOT数据集上,表现效果不佳