1.引 言
学术界对短时追踪的算法研究较早,但实际应用中长时追踪具有更大的实际意义。近年来,在长程跟踪算法方面:SiamRPN算法提出一种孪生候选区域生成网络,作者预先计算孪生子网络中的模板支路,也就是第一帧,并且将它构造成一个检测支路中区域提取网络里面的一个卷积层,用于在线跟踪[1];SiamFC++ 引入分类和目标状态估计分支、无歧义分类得分、无先验知识跟踪和估计质量得分进行设计,通过离线学习相似度的度量函数,并在跟踪过程中在搜索图像中进行模板图像(目标)的定位[2];中科院和中科院大学在二阶段目标检测器Faster R-CNN启发下发明GlobalTrack 算法,把目标跟踪看为全局实例搜索问题,其对视频每一帧的跟踪完全不依赖相邻帧,没有累计误差使得它在长期跟踪问题中准确率保持稳定[3]。
2.背 景
目标跟踪
目标跟踪是计算机视觉研究的重点问题之一,是理解图像高层语义信息的重要基础。
随着智能视频监控、人脸识别门禁系统、自动驾驶、机器人视觉导航等贴近人们日常生活的视频数据的暴增,视频目标检测的研究具有更大的现实研究意义与应用价值。通过扫描、跟踪物体的行为运动轨迹,来分析出关键特征值,进一步作出实时的预测,是实现诸多技术的基础。
长程追踪
目标跟踪在大数据时代意义非凡,但现今各种目标跟踪算法在处理如光照变化、物体遮挡、图像噪声、低光照、快速运动和类似颜色背景,尤其是长程追踪等问题上仍悬而未决[4]。相较于只有几十秒的短时追踪,长程追踪可处理的视频序列更长,在智能交通,智能驾驶等实际领域中有着至关重要的作用。鲁棒性强、适应性好的长程追踪算法急需提出。
GlobalTrack算法
针对以上问题,中科院和中科院大学在二阶段目标检测器Faster R-CNN启发下发明GlobalTrack算法,把目标跟踪看为全局实例搜索问题,其对视频每一帧的跟踪完全不依赖相邻帧,没有累计误差使得它在长期跟踪问题中准确率保持稳定,在主流的数据集上表现良好[5]。
GlobalTrack理论模型
图3.1 GlobalTrack模型框架
本小组通过参考各类文献,特别是作者原著,了解了GlobalTrack算法模型的基本框架(原著模型框架如图2.1)。如下,本小组通过自主学习与研讨,整理了GlobalTrack的模型框架,为模型的代码复现铺垫。