一、概述
K-means聚类算法(Intrinsic Shape Signatures):是一种无监督学习算法,主要用于数据聚类。该算法的主要目标是找到一个数据点的划分,使得每个数据点与其所在簇的质心(即该簇所有数据点的均值)之间的平方距离之和最小。
基本思想:
- 首先需要预定义簇的数量K,然后随机选择K个对象作为初始的聚类中心。
- 算法会遍历数据集中的每个对象,根据对象与各个聚类中心的距离,将每个对象分配给距离它最近的聚类中心。
- 根据分配结果,算法会重新计算每个簇的聚类中心,新的聚类中心是该簇所有对象的均值。
- 重复第2步和第3步,直到满足某个终止条件,直到聚类中心的位置不再发生变化,或者达到预定的迭代次数。
二、代码示例
import numpy as np