K-Means聚类

最新推荐文章于 2022-03-08 19:02:31 发布

zlc911202

最新推荐文章于 2022-03-08 19:02:31 发布

阅读量451

点赞数 1

分类专栏：机器学习文章标签： k-means 算法机器学习

本文链接：https://blog.csdn.net/u014088052/article/details/50864588

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

K-Means聚类

算法基本流程

随机选取k个中心点
遍历所有数据，将每个数据划分到最近的中心点中
计算每个聚类的平均值，并作为新的中心点
重复2-3，直到这k个中线点不再变化（收敛了），或执行了足够多的迭代

时间复杂度：O(I*n*k*m)
空间复杂度：O(n*m)
其中m为每个元素字段个数，n为数据量，I为迭代个数。一般I,k,m均可认为是常量，所以时间和空间复杂度可以简化为O(n)，即线性的。

算法详解

首先是距离计算方式的选择，一般有两种计算方式，一是欧式距离，而是曼哈顿距离
计算聚类中心的方法

Minkowski Distance $d i j = λ \sum k = 1 n | x i k - x j k | λ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾  ⎷  $ $d_{ij}=\lambda\sqrt{\sum_{k=1}^n|{x_{ik}-x_{jk}|^\lambda}}$ λ 可以随意取值，可以是负数，也可以是正数，或是无穷大
Euclidean Distance $d i j = \sum k = 1 n | x i k - x j k | 2 ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾  ⎷  $ $d_{ij}=\sqrt{\sum_{k=1}^n|{x_{ik}-x_{jk}|^2}}$
CityBlock Distance $d i j = \sum k = 1 n | x i k - x j k |$ $d_{ij}=\sum_{k=1}^n|{x_{ik}-x_{jk}|}$

zlc911202

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K-Means聚类

K-Means聚类算法基本流程随机选取k个中心点遍历所有数据，将每个数据划分到最近的中心点中计算每个聚类的平均值，并作为新的中心点重复2-3，直到这k个中线点不再变化（收敛了），或执行了足够多的迭代时间复杂度：O(I*n*k*m) 空间复杂度：O(n*m) 其中m为每个元素字段个数，n为数据量，I为迭代个数。一般I,k,m均可认为是常量，所以时间和空间
复制链接

扫一扫

专栏目录