MeanShift算法(一)

最新推荐文章于 2024-03-30 08:47:19 发布

ZYTTAE

最新推荐文章于 2024-03-30 08:47:19 发布

阅读量9.2k

点赞数 4

分类专栏： Image Processing 文章标签： MeanShift理论 MeanShift算法核函数跟踪聚类

本文链接：https://blog.csdn.net/zyttae/article/details/41493209

版权

Image Processing 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

参考论文：D. Comaniciu and P. Meer, “Mean shift: A robust approach toward feature space analysis,” IEEE T. PAMI, vol. 24, no. 5, pp. 603-619, May 2002

MeanShift 可以翻译为“均值漂移”，它在聚类、图像平滑、图像分割和跟踪方面得到了比较广泛的应用。MeanShift 这个概念最早是由Fukunaga等人于1975年在一篇关于概率密度梯度函数的估计（The Estimation of the Gradient of a Density Function, with Applications in Pattern Recognition）中提出来的。其最初含义正如其名：就是偏移的均值向量。在这里MeanShift是一个名词，它指代的是一个向量。但随着Mean Shift理论的发展，MeanShift的含义也发生了变化。如果我们说MeanShift算法，一般是指一个迭代的步骤，即先算出当前点的偏移均值，移动该点到其偏移均值，然后以此为新的起始点继续移动，直到满足一定的条件结束。

在很长一段时间内，MeanShift算法都没有得到足够的重视，直到1995年另一篇重要论文的发表。该论文的作者Yizong Cheng定义了一族核函数，使得随着样本与被偏移点的距离不同，其偏移量对均值偏移向量的贡献也不同。其次，他还设定了一个权重系数，使得不同样本点的重要性不一样，这大大扩展了MeanShift的应用范围。此外，还有研究人员将非刚体的跟踪问题近似为一个MeanShift的最优化问题，使得跟踪可以实时进行。目前，利用MeanShift进行跟踪已经相当成熟。MeanShift算法其实是一种核密度估计算法，它将每个点移动到密度函数的局部极大值点处。

下面介绍MeanShift算法的理论：

在给定d维空间R^d的n个样本点,i=1,…,n.则核密度估计函数可以表示为：

核函数K(x)满足如下关系：

归一化：

对称性：

权重的指数衰减：

?????条件：

其中上式c为常数。对于有限数量的data，实际应用中K(x)有两种获取的形式：

第一种形式，在各个维度上都使用相同的函数k(x)，第二种形式表示只使用了向量的长度。因为||*||表示欧式距离。在R^{d表示的d维空间中，参数h是样本数量n的函数，应当满足，从而保证估计的}^{渐进无偏性}^{。为了确保估计的}^{均方一致性}^{，h需要满足条件：。为了确保}^{全局一致性}^{，h需要满足条件.}

^{其中，当核函数采用Epanechnikov核时，均方误差最小。Epanechnikov核表示为：}

其中为d维单位球体体积。另外一个也被用到的核函数为高斯核：

定义核函数的轮廓(profile，也可翻译为剖面函数)函数k(x)满足k:[0,)->R，即

其中为归一化常数，保证K(x)积分为1，且严格为正。由此带入最初的核密度估计函数，可将核密度估计函数重写为：

下面介绍Kernel DensityGradient Estimation:

定义一个轮廓函数(profile),并且构造出g(x)的核函数：

参考文献中说K(x)was called the shadow of G(x)，这里不太理解这个shadow的意思?同样也说Epanechnikov kernel is the shadow of the uniform kernel??

根据核函数的可微性，密度梯度估计恒等于核密度估计的梯度，可以得到：

将g(x)带入上式得到：

假设大于0。可以得到关于核函数G在点x的表达式如下，可理解为以G为核函数对概率密度函数f(x)的估计：

则mean shift向量可表示为：

以核函数作为权重，x作为窗口的中心。

上面的式子表明，在点x处，基于核函数G(x)的mean shift向量与基于核函数K(x)的密度梯度估计仅相差一个常数的比例系数。而梯度是指密度变化最大的方向，所以mean shift向量也是指向密度增大最大的方向。

反复进行以下步骤就是MeanShift算法的过程：

1）计算mean shift向量；

2)根据，移动核（窗口）；

3）若，则结束循环，否则继续迭代。

最终核函数的中心点收敛到数据空间中密度最大的点，它的密度梯度估计为0。mean shift向量也总是指向密度增大最大的方向，这可由上式的分子项来保证。而分母项则表示每次迭代核函数移动的步长。在不包含兴趣特征的区域内，步长较长；在感兴趣的区域内，步长较短。即MeanShift算法是一个变步长的梯度上升算法，或称为自适应梯度上升算法。

小结：

根据mean shift向量，定义半径为h的高维球区域S_{h，并满足一下关系的y点的集合：}

k表示在这n个点x_{i中，有k个点落入S_{h区域中。}}

_{_{我们可以看到(x_{i - x})是样本点x_i相对于点x的偏移向量。mean shift向量就是对落入区S_h中的k个样本点相对于点x的偏移向量求和然后再平均。从直观上看，如果样本点x_i从一个概率密度函数f(x)中采样得到，由于非零的概率密度梯度指向概率密度增加最大的方向。}_{因此从平均上来说，区域内的样本点更多的落在沿着概率密度梯度的方向。因此，对应的mean shift向量应该指向概率密度梯度的方向。}_{如下图所示：}}

_{_{大圆圈所圈定的范围就是S_h，小圆圈代表落入S_h区域内的样本点。黑点就是meanshift的基准点，箭头表示样本点相对于基准点x的偏移向量。很明显的，我们可以看出平均的偏移向量会指向样本分布最多的区域，也就是概率密度函数的梯度方向。把每个偏移向量相加就可以得到meanshift向量，再以meanshift向量的终点，即质心画球，移动，重复此过程即可收敛到概率密度最大的方向。即最稠密，密集的地方。}}