机器学习算法与Python实践之（五）k均值聚类（k-means）原理补充

最新推荐文章于 2022-03-10 17:07:38 发布

西湖太极熊

最新推荐文章于 2022-03-10 17:07:38 发布

阅读量333

点赞数

分类专栏：机器学习算法文章标签： python 机器学习算法聚类算法

本文链接：https://blog.csdn.net/xiong_1987427/article/details/78475006

版权

机器学习算法专栏收录该内容

11 篇文章 0 订阅

订阅专栏

Mean-shift

 1)概述

   Mean-shift（即：均值迁移）的基本思想：在数据集中选定一个点，然后以这个点为圆心，r为半径，画一个圆(二维下是圆)，求出这个点到所有点的向量的平均值，而圆心与向量均值的和为新的圆心，然后迭代此过程，直到满足一点的条件结束。(Fukunage在1975年提出)

  后来Yizong Cheng 在此基础上加入了 核函数 和 权重系数 ，使得Mean-shift 算法开始流行起来。目前它在聚类、图像平滑、分割、跟踪等方面有着广泛的应用。

2）图解过程

   为了方便大家理解，借用下几张图来说明Mean-shift的基本过程。



    由上图可以很容易看到，Mean-shift 算法的核心思想就是不断的寻找新的圆心坐标，直到密度最大的区域。

3）Mean-shift 算法函数

   a）核心函数：sklearn.cluster.MeanShift(核函数：RBF核函数)

       由上图可知，圆心(或种子)的确定和半径(或带宽)的选择，是影响算法效率的两个主要因素。所以在sklearn.cluster.MeanShift中重点说明了这两个参数的设定问题。

   b）主要参数

       bandwidth ：半径(或带宽)，float型。如果没有给出，则使用sklearn.cluster.estimate_bandwidth计算出半径(带宽).（可选）

       seeds :圆心（或种子），数组类型，即初始化的圆心。（可选）

       bin_seeding ：布尔值。如果为真，初始内核位置不是所有点的位置，而是点的离散版本的位置，其中点被分类到其粗糙度对应于带宽的网格上。将此选项设置为True将加速算法，因为较少的种子将被初始化。默认值：False.如果种子参数(seeds)不为None则忽略。

   c）主要属性

      cluster_centers_ : 数组类型。计算出的聚类中心的坐标。

      labels_ :数组类型。每个数据点的分类标签。

西湖太极熊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法与Python实践之（五）k均值聚类（k-means）原理补充

Mean-shift 1)概述 Mean-shift（即：均值迁移）的基本思想：在数据集中选定一个点，然后以这个点为圆心，r为半径，画一个圆(二维下是圆)，求出这个点到所有点的向量的平均值，而圆心与向量均值的和为新的圆心，然后迭代此过程，直到满足一点的条件结束。(Fukunage在1975年提出) 后来Yizong Cheng 在此基础上加入了核函数和权重系数，使得Mean-shift
复制链接

扫一扫