关于深度学习在目标跟踪领域的学习心得
目标跟踪算法可以被分为产生式(generative model)和判别式(discriminative model)两大类别,产生式方法运用生成模型描述目标的表观特征,之后通过搜索候选目标来最小化重构误差;判别式方法通过训练分类器来区分目标和背景。在现实情况中,由于目标跟踪只提供第一帧的bounding box,且具有不确定性,在遮挡、旋转、光照变换等情况下易产生目标对象漂移、跟踪失败的情况。我们可以利用深度模型对大量标注或未标注训练数据进行预训练并学习,提高目标跟踪的准确率和实时性(现行大部分深度学习目标跟踪方法都归属于判别式框架)。现将了解到的主要实现方法归纳如下:
一、利用辅助图片数据预训练深度模型,在线跟踪时微调
代表:①Learning a Deep Compact Image Representation for Visual Tracking NIPS2013
②Transferring Rich Feature Hierarchies for Robust Visual Tracking arXiv2015
虽然解决了跟踪过程中训练样本不足的问题,但是辅助图片是无关联的,使用更贴合跟踪实质的关联数据会是更好的选择。
二、利用现有大规模分类数据集预训练深度模型
CNN分类网络提取特征
代表:①Visual Tracking with Fully Convolutional Networks ICCV2015
FCNT通过对大规模分类数据集训练出的CNN网络获得目标的特征表示,并可以通过不