文章:Real-time Visual Tracking Using Compressive Sensing
作者:Hanxi Li, Chunhua Shen, Qinfeng Shi
来源:CVPR
1. 总述
本文也是通过对候选目标进行稀疏表示来实现目标跟踪的。其采用的框架和L1跟踪器相同,可以说本文将L1跟踪实时化了。总体来说本文主要有以下贡献:
(1)将L1跟踪做到了实时。充分利用压缩感知恢复信号的能力,显著的降低了计算复杂度。就是将高维的信号压缩到低维的信号空间来求解信号的稀疏表示,同时提出正交匹配追踪算法对目标函数进行优化。
(2)不像L1中那样,采用简单的模板对干扰和噪声进行表示,这里引进了背景模板,将简单模板替换为背景模板,记做RTCST-B。虽然文中说性能有很大的提高,但是该算法只适用于摄像机固定的场景。
(3)提出了一种新的度量标准,Tracking Success Probability(TSP).
本文于L1跟踪最大的不同就是寻求候选目标的稀疏表示的目标函数不同,相对采用的优化方法也不同。
2. 算法细节
(1)压缩感知
压缩感知理论表示,一个稀疏的信号X可以采用很少的几个测量,以很大的可能精确恢复出来。X的求解过程为:
由于上述问题为一个NP困难问题,因此一般不最小化0范数,而是采用1范数。同时,为了应对噪声,一般优化下面的二阶凸优化问题。
(2)RTCST
在本文的RTCST算法中,需要优化的目标函数为:
通过一个满足RIP条件的随机映射矩阵(高斯矩阵和hashing)将高维的特征空间压缩到低维的特征空间,可想而知,这样在优化的过程中速度可以有很大的提高。
--------------------------------
唉,敲了半天没保存好丢了,不重写了,接着丢之前写,哭。。。。。
--------------------------------
3. 总结
本文提取的两种跟踪器:RTCST和RTCST-B。是在L1的基础上进行了改进,利用了压缩感知恢复信号的能力,最重要的提升是速度方面。可以说本文将L1跟踪器做到了实时。
对于效果跟踪方面和L1不相上下,有些视频还不如L1。。 RTCST-B效果较好的是针对摄像机固定的情况,这在一定程度上限制了它的应用。因为RTCST-B中引进了背景模板,因此效果有所提升是很自然的。(个人感觉实验没有可比性,如果待比较的算法针对摄像机固定情况进行改进,说不效果也很好。)
最后,作者提出了两个改进的方向:
(1)在特征中加入颜色特征,这对于效果的提升是可想而知的、
(2)对目标进行分块跟踪,将一个目标的不同部分作为不同的跟踪目标同时跟踪,以期有效果的提升。
完了,不知道大家可以理解不。加油。