原创文章,转载复制先请声明
1、算法概要
概要是很重要的,你能看到作者灵感的由来。
作者在abstract中说明了其想法的由来,在将机器学习方法引入到目标跟踪领域后形成的判别式方法十分吸引人,但是由于所需要的训练样本过多,传统算法基本上都是采用随机稀疏采样子窗口来训练的,因为密集采样所带来的计算负担过重。于是CSK算法从这点入手,研究密集采样下的训练方法,发现了密集采样得到的样本集具有循环矩阵的结构特征。
然后在循环矩阵的基础上,作者引入了FFT傅里叶变换加快了算法的速度,并通过引入核技巧将原来的图像空间转换成了非线性高位空间的回归问题,增加了准确性。
读到这里其实可以发现,CSK算法就是对于MOSSE算法的升级和拓展,在MOSSE上引入了核技巧以及后面要介绍的岭回归方法。
作者说了一句非常impressed的话:引入了相关滤波器的算法最重要的一个细节就是在傅氏空间中的计算根本就没有迭代过所有的子窗口。(仔细思考MOSSE中的周期拓扑和CSK中的循环矩阵实际上都是隐式的密集采样了所有子窗口,这也是相关滤波方法最重要的一个特点,而且对于这部分的理解上,CSK引入了padding变量,扩大搜索区域,这样在滑动求相关的过程,只有目标的循环样本到了中心时相应图才会出现高亮,理解起来更有意思,相比MOSSE的一个进步)
2、算法流程
2.1密集采样
tracking-by-detection的核心就是训练一个分类器,以前的算法都是采用随机稀疏采样的方法获得sample的,但是作者却在本文中引入了密集采样的概念,并发现了它具有循环矩阵的结构特征。(其实和MOSSE中的预处理过程是一样的,都是将目标窗口进行了周期拓扑,方便后续的FFT计算)
2.2带有正则项的优化问题
这里是相对于MOSSE算法的一次改进引入了核技巧
有了密集采样后的样本后,作者接着进行了回归拟合,区别于分类,回归的特点是使得特征更加平滑,计算更加方便。于是跟踪问题转化为了一个关于带有正则项代价函数的优化问题:
采用岭回归的方法对问题进行求解,其中
正则项增加的目的是为了排除一些循环矩阵变换后变形过度的虚拟样本。如果在此基础上引入核技巧,将会使得算法性能更进一步提升,将输入像素空间的信息投影到高位空间中,定义一下核函数:
由岭回归的知识可以得到w的隐式表达形式:
引入了核技巧后,对于w进行详细推导:
当输入第i个样本时,f(xi)为
所以,得到:
而对于正则项:
原优化问题可以写为如下形式:
求导得到
最后得出论文中的结论,此回归问题可解:
2.3引入循环矩阵求解
作者介绍了密集采样的概念,实际上密集采样的样本就是利用单一的跟踪窗口生成它的循环矩阵形式,然后去训练分类器。给出了最重要的一个公式:
然后作者给出了循环矩阵的一个重要性质,循环矩阵对应的核函数也是循环矩阵形式的,那么对于
其中,ki是由单一窗口密集采样后生成的核函数对应值
利用最重要的公式进行推导得到:
2.4目标跟踪的响应过程
在c初始帧上得到
K核函数仍然是一个循环矩阵
利用上面最重要的那个公式就可以得到:
核函数的计算有多种方法,本文采用了RBF函数,其中