【ML】Mean-Shift 原理 + 实践（基于sklearn）

最新推荐文章于 2024-05-17 21:05:26 发布

生活就像一杯茶

最新推荐文章于 2024-05-17 21:05:26 发布

阅读量378

点赞数

分类专栏：机器学习算法 python 文章标签： sklearn python

本文链接：https://blog.csdn.net/weixin_43002640/article/details/128297611

版权

机器学习同时被 3 个专栏收录

18 篇文章 1 订阅

订阅专栏

算法

16 篇文章 0 订阅

订阅专栏

python

12 篇文章 0 订阅

订阅专栏

【ML】Mean-Shift 原理 + 实践（基于sklearn）

原理
实践

原理

取数据集中的一个点为X，以此点为中心画一个半径为R的圆，圆内共有点数量假设为K。
以此点为起点，其他圆内点为终点计算出所有向量并相加除以K得到meanshift向量M(x)。
令X=X+M(x)，然后从第一步继续开始，然后迭代此过程直到中心点（质心）不变。
再取剩下的其他点，进行此过程，直到所有点都计算完成。
每个点计算质心时，迭代一定次数，当质心变化小于某个阈值时停止迭代，并搜索当前质心附近质心进行归类（小于一定阈值内的质心）。

演示：
在这里插入图片描述

实践

生成数据

import numpy as np
from sklearn.cluster import MeanShift, estimate_bandwidth
from sklearn.datasets import make_blobs

centers = [[1, 1], [-1, -1], [1, -1]]
X, _ = make_blobs(n_samples=10000, centers=centers, cluster_std=0.6)

训练

bandwidth = estimate_bandwidth(X, quantile=0.2, n_samples=500)

ms = MeanShift(bandwidth=bandwidth, bin_seeding=True)
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

labels_unique = np.unique(labels)
n_clusters_ = len(labels_unique)

print(labels_unique)
print("number of estimated clusters : %d" % n_clusters_)

预测+评估

y_predict = ms.predict(X)
from matplotlib import pyplot as plt
plt.figure()
plt.scatter(X[:,0],X[:,1],c=y_predict)

在这里插入图片描述

生活就像一杯茶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录