Real-time Compressive Tracking目标跟踪算法理解

作者个人主页:http://www4.comp.polyu.edu.hk/~cslzhang/CT/CT.htm
Real-time Compressive Tracking(CT)算法特点是实现非常简单,主要多一些积分运算,提取类似于haar-like这种特征,再通过简单的朴素贝叶斯分类器实现一个discriminative model。因此运算速度非常快,效果也挺不错的,但是相对于那些复杂的跟踪算法比如Struck、VTS、TLD等还是准确度低一些。

一、准备工作
1)随机映射
理想情况下,我们希望矩阵R保持所有原始信号之间的距离不变。JohnsonLindenstrauss引理指出,如果特征被投影到合适维度的随机子空间,那么向量空间中的点的距离以大概率保持不变。Baraniuk等人指出满足JohnsonLindenstrauss定理的随机矩阵也具有压缩感知中的限制等距性质。所以,如果随机矩阵R满足JohnsonLindenstrauss定理,当x是音频或图像这种压缩信号时,我们就很可能以很小的误差从v重建x。可以保证v保留了x几乎所有信息。这个强有力的理论支持促使我们通过低维随机映射来分析高维信号。在算法中,我们使用一个非常稀疏的矩阵,不仅满足JohnsonLindenstrauss定理,而且可以高效地计算以满足实时跟踪。

2随机测量矩阵
一个典型的满足限制等距性质的测量矩阵是随机高斯矩阵。然而,由于矩阵是稠密的,存储和计算负荷比较大。本文采用一个非常稀疏的随机测量矩阵,定义为:
这里写图片描述

Achlioptas证明了当s=2或3时,这种类型矩阵满足Johnson-Lindenstrauss定理。这种矩阵非常容易计算,仅需要均匀分布的随机生成器。当s=3时,三分之二的计算量是可以避免的。

二、算法介绍
下面这部分将详细的讲述跟踪算法。我们假定第一帧中的跟踪窗口已经确定。在接下来的每一帧中,从当前目标位置附近采得正样本,从距离目标中心较远处采得负样本用于更新分类器。为了预测下一帧中目标的位置,我们从目标中心位置附近采得样本,再找的具有分类器得分最大的一个作为跟踪结果。

)

1)有效降维
对每一个样本z,将其与一系列矩形滤波器卷积表示。
这里写图片描述

其中i和j分别是矩形滤波器的宽和高。然后将每一个滤波后的图像表示成列向量,再将他们联结成一个非常高维的多尺度图像特征向量。维度通常在十的六次方到十的十次方。我们采用一个非常稀疏的随机矩阵将x映射到低维空间向量v上。随机矩阵R只需离线计算一次,在整个跟踪过程保持不变,因此计算负荷比较小。在图2中,我们仅仅需要存储矩阵R中的非零项。

这里写图片描述

2)分析低维压缩特征
低维特征v中的每个分量是不同尺度下空间分布矩形特征的线性组合。由于测量矩阵的系数可能是正的或负的,压缩特征计算相对像素值差的方式非常类似于Haar-like特征。
这里写图片描述

3)分类器的构造与更新
对于每个样本z,它的低维表示是v。我们假定v中所有元素是独立分布的,并且用朴素贝叶斯分类器建模,
这里写图片描述

其中y是表示样本标签的二元变量,假定p(y=1)=p(y=0)。
Diaconis and Freedman指出高维随机向量的随机映射几乎都是高斯分布的。因此,分类器H中的条件分布被假定为具有四个参数的高斯分布,

这里写图片描述

4)下面是算法主要步骤的总结:
输入:视频第t帧序列
1.在上一帧目标中心周围选取样本,并提取低维特征。
2.通过分类器H找出具有最大分类得分的特征向量,其对应的目标位置作为跟踪结果。
3.采集正负样本集。
4.提取样本特征并更新分类器。
输出:跟踪结果和分类器参数

这里写图片描述

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页