机器学习-*-MeanShift聚类算法及代码实现

最新推荐文章于 2024-06-16 08:00:00 发布

link-ai

最新推荐文章于 2024-06-16 08:00:00 发布

阅读量2.8k

点赞数 2

分类专栏：机器学习 Python 文章标签：均值漂移 MeanShift 聚类

本文链接：https://blog.csdn.net/u013894072/article/details/84553750

版权

MeanShift是一种基于密度的聚类算法，常用于目标追踪。算法通过不断迭代，寻找高密度区域作为类簇中心。一般形式是计算点与其领域内点的平均距离，核函数形式引入权重，使得靠近中心的点影响更大。Python实现中，利用高斯核函数进行改进，无需预设类簇数量。与KMeans相比，MeanShift更能适应非球形类簇，但需要调整参数如radius和bandwidth。

摘要由CSDN通过智能技术生成

MeanShift

该算法也叫做均值漂移，在目标追踪中应用广泛。本身其实是一种基于密度的聚类算法。
主要思路是：计算某一点A与其周围半径R内的向量距离的平均值M，计算出该点下一步漂移（移动）的方向（A=M+A）。当该点不再移动时，其与周围点形成一个类簇，计算这个类簇与历史类簇的距离，满足小于阈值D即合并为同一个类簇，不满足则自身形成一个类簇。直到所有的数据点选取完毕。

一般形式

对于给定的 n 维空间 $R^n$ 中的 m 个样本点 $X^i$ ，i=1…m，对于其中一个样本X，他的均值漂移向量为： $M_h(X)=\frac{1}{K}*\sum_{X^i\in S_h}(X^i-X)$ ，其中 $S_h$ 指的是一个半径为h的球状领域，定义为 $S_h(X)=\{y|(y-x)(y-x)^T \le h^2\}$ ，如下图所示
在这里插入图片描述
蓝色圈内表示半径h的区域 $S_h$ ，黄色箭头尾部指的是计算前的数据点 $X$ ，箭头本身是指的计算后的漂移向量 $M_h (X)$ 。由上图可以看出，均值漂移会不断的往密度较大的区域移动。熟悉的同学可能了解到，一般用的

最低0.47元/天解锁文章

link-ai

关注

2
点赞
踩
24

收藏

觉得还不错? 一键收藏
3
评论
机器学习-*-MeanShift聚类算法及代码实现

MeanShift该算法也叫做均值漂移，在目标追踪中应用广泛。本身其实是一种基于密度的聚类算法。主要思路是：基于某一点的周围半径R内的点向量，计算出该点下一步移动的路线。当该点不再移动时，计算其与历史类簇的距离，满足阈值要求的即合并，不满足则自身形成一个类簇。本身有改进的核方法，这里不阐述了。后续会加上有时间补充概念，先上代码及实验结果：Python代码#!/usr/bin/pytho...
复制链接

扫一扫

专栏目录