CVPR2018一共有三篇用Adverarial思想做tracking的文章。VITAL和SINT++不约而同都是处于利用adverarial的概念对缺乏diversity的在线采集正样本进行增强。
本文是UC Merced 大神Ming-Hsuan Yang与腾讯的强强联合,推出的一篇性能比肩ECO和MDNet的online trained two-stage T-by-D tracker。本文突出解决two-stage单目标跟踪器(先在原位置random sample得到candidates,再由classifier打分择优)在线训练classifier的正样本匮乏(目标上一帧跟踪位置周围密集随机采样导致正样本互相之间相似,不diverse)和正负样本imbalance的问题,提出用GAN的思想实现正样本增强,并用一种新的类focal loss解决hard negative mining(非要点,不多谈)。
本文最大的contribution是提出了一个类attention的(两层FC得到一个mask,再将此mask element-wise“dropout”即与前端feature extractor CNN feature map相乘)GAN中的generator,实现feature级而非image级的“生成”。这里的生成,指的是特征选择feature selection(通过mask加权),选择出样本中更加时序稳定robust的特征,而不是