要解决的三个问题:
1、有干扰物效果不佳;(单纯将背景前景区分,并未使用语义信息)
2、跟踪阶段不能更新模型;(提高了速度,降低了性能)
3、长时间跟踪应用时,对全遮挡,目标出画面等情况效果不佳
训练数据中的非语言背景和具有语义的干扰物背景的数据不平衡是进一步学习的主要障碍。
1、增加了三类样本对(数据增强)
ILSVRC2015VID + Youyube-BB + ILSVRC2015 + COCO数据集
增加不同类别的困难负样本(避免跟踪效果漂移)
增加相同类别的困难负样本(更加关注目标的细节信息)
2、干扰物感知模型(增量学习方法)
在跟踪时,上一帧利用最大值抑制选出多个proposals,最高的值为跟踪结果,其他大于某阈值的proposals即为干扰物,然后利用distractor-aware object function对proposal重新排序,然后在跟踪时,响应得分要减去这些干扰物和搜索区域的响应
https://blog.csdn.net/sinat_31184961/article/details/83866339
3、对于长时跟踪问题
提出在短时跟踪和失败情况的切换方法,即跟踪失败时,采取局部到全局的搜索策略来重新检测目标
detection score指示出跟踪目标的丢失,然后启动local-to-global search strategy策略
“Since the distractor-aware training and inference enable highquality detection score, it can be adopted to indicate the quality of tracking results.”