近几年跟踪算法总结

跟踪算法在视频处理中至关重要,跟踪即检测到想要的目标对象,并盯住不放。在近几年出现的算法中,大多是将跟踪与检测相结合,来实现更好的跟踪效果。在今年的CVPR大会上,更是出现了基于CNN学习的跟踪算法,每种算法各有利弊,具体还要根据实际情况进行取舍。本文总结了近几年出现的不错的跟踪算法,首先对该算法的特点进行了简单的总结,具体内容及讲解请参看链接中大神的博文。另外这些算法大多提供了开源的代码和论文,想更进一步的了解还是看原文更给力。

1、KCF(KernelizedCorrelation Filter)

是一种Tracking ByDetection的跟踪方法,以跟踪对象为正样本,以周围坏境为负样本,训练一个判别分类器。之所以能有这么快的速度,得益于作者巧妙地通过循环偏移构建出了分类器的训练样本,从而使得数据矩阵变成了一个循环矩阵。然后基于循环矩阵的特性把问题的求解变换到了离散傅里叶变换域,从而避免了矩阵求逆的过程,降低了好几个数量级的算法复杂度。

 

链接:http://blog.csdn.net/zwlq1314521/article/details/50427038

2、CMT跟踪算法(CVPR 2015)

对于物体的视觉跟踪,基本的思路就是能够不断监测到物体的特征,从而不断的得到物体的位置,实现跟踪。常见的有三种方法:

第1是基于整体的模型来跟踪,比如说TLD,通过不断的更新模型(也就是学习的过程)来实现对物体特征的良好表示。

第2是基于物体的局部来跟踪,就是将物体分解为多个部分,对每一部分进行单独的跟踪,采用光流等方法

第3是基于物体的特征点来跟踪,就是实时的监测物体的特征点,与一开始的特征点进行匹配的方法来实现物体的跟踪。

 

基于物体的特征点来跟踪,就是实时的监测物体的特征点,与一开始的特征点进行匹配的方法来实现物体的跟踪。

计算特征点的相对位置,以框的中心来进行计算,对于不形变的物体而言,不管物体怎么移动旋转,其上面的特征点相对中心的距离是在缩放比例下是确定的,因此可以由此来排除不是的特征点。从而判断下一帧的图像中哪些特征点是与当前的框中的特征点相匹配。

作者获取下一帧的特征点做了两部分工作:1是计算前一帧的框中的特征点的光流,从而得到当前帧的特征点位置,另一个方法是直接计算当前帧的特征点,并与上一帧的特征点进行匹配,得到相匹配的特征点,然后把两个得到的特征点都融合在一起。就得到了下一帧的初步的特征点。然后在对特征点进行筛选,采用的就是上一段说的方法。


链接:http://blog.csdn.net/songrotek/article/details/47775131

3、CT

一种简单高效地基于压缩感知的跟踪算法。首先利用符合压缩感知RIP条件的随机感知矩对多尺度图像特征进行降维,然后在降维后的特征上采用简单的朴素贝叶斯分类器进行分类。该跟踪算法非常简单,但是实验结果很鲁棒,速度大概能到达40帧/秒。


链接:http://www.mamicode.com/info-detail-529588.html

4、STC  时空上下文

通过贝叶斯框架对要跟踪的目标和它的局部上下文区域的时空关系进行建模,得到目标和其周围区域低级特征的统计相关性。然后综合这一时空关系和生物视觉系统上的focus of attention特性来评估新的一帧中目标出现位置的置信图,置信最大的位置就是我们得到的新的一帧的目标位置。

另外,时空模型的学习和目标的检测都是通过FFT(傅里叶变换)来实现,所以学习和检测的速度都比较快。


链接:http://blog.csdn.net/songrotek/article/details/47775131

5、TLD

将传统的跟踪算法和传统的检测算法相结合来解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。同时,通过一种改进的在线学习机制不断更新跟踪模块的显著特征点和检测模块的目标模型及相关参数,从而使得跟踪效果更加稳定、鲁棒、可靠。

 

链接:http://www.asmag.com.cn/tech/201203/50168.html

              http://blog.csdn.net/mysniper11/article/details/8726649

6、Struck

提出一种基于结构输出预测自适应视觉目标跟踪的框架,通过明确引入输出空间满足跟踪功能,能够避免中间分类环节,直接输出跟踪结果。同时,为了保证实时性,该算法还引入了阈值机制,防止跟踪过程中支持向量的过增长。

 

链接:http://blog.csdn.net/qianxin_dh/article/details/39377959

7、MdNet(CVPR2016)

MDNet提出直接用跟踪视频预训练CNN获得general的目标表示能力的方法。MDNet提出Multi-Domain的训练思路和如上图所示的Multi-Domain Network。该网络分为共享层domain-specific两部分。即:将每个训练序列当成一个单独的domain,每个domain都有一个针对它的二分类层(fc6),用于区分当前序列的前景和背景,而网络之前的所有层都是序列共享的。这样共享层达到了学习跟踪序列中目标general的特征表达的目的,而domain-specific层又解决了不同训练序列分类目标不一致的问题。

 

链接: http://www.eefocus.com/component/362248/p4

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值