Mean Shift(均值漂移)是基于密度的非参数聚类算法,其算法思想是假设不同簇类的数据集符合不同的概率密度分布,找到任一样本点密度增大的最快方向(最快方向的含义就是Mean Shift),样本密度高的区域对应于该分布的最大值,这些样本点最终会在局部密度最大值收敛,且收敛到相同局部最大值的点被认为是同一簇类的成员。
Mean Shift在计算机视觉领域的应用非常广,如图像分割,聚类和视频跟踪,小编曾经用Mean Shift实现目标跟踪,效果还不错。本文详细的总结了Mean Shift算法原理。
目录
1.核密度估计
2.Mean Shift算法
3.图解Mean Shift算法
4.带宽对Mean Shift算法的影响
5.图像分割
6.聚类
7.Mean Shift算法优缺点
1.核密度估计Mean Shift算法用核函数估计样本的密度,最常用的核函数是高斯核。它的工作原理是在数据集上的每一个样本点都设置一个核函数,然后对所有的核函数相加,得到数据集的核密度估计(kernel density estimation)。
假设我们有大小为n的d维数据集,核函数K的带宽为参数h。
数据集的核密度估计:
其中K(x)是径向对称函数(radially symmetric kernels),定义满足核函数条件的K(x)为:
其中系数