均值漂移(Meanshift)算法是基于核密度估计的爬山算法
概念补充
1.核函数:将原始空间中的向量作为输入向量,并返回特征空间(转换后的数据空间,可能是高维)中向量的点积的函数称为核函数
2.核密度估计:估计未知的密度函数,属于非参数检验方法之一
1.算法流程
设想在一个有N个样本点的特征空间,利用mean shift算法对数据进行分类:
1.初始确定一个中心点center,计算在设置的半径为D的圆形空间内所有的点与中心点center的向量
2.计算整个圆形空间内所有向量的平均值,得到一个偏移均值
3.将中心点center移动到偏移均值位置
4.重复移动,直到满足一定条件结束
Meanshift图解过程
2.核心算法
2.1核函数
引入目的:使得随着样本与被偏移点的距离不同,其偏移量对均值偏移向量的贡献也不同。
常用的核函数:高斯核函数
2.2核心算法思想
计算每个点的偏移均值,然后根据新计算的偏移均值更新点的位置