些天文学上的细节问题。好的,这就是聚类算法。这将是我们介绍的第一个非监督学习算法,接下来,我们将开始介绍一个具体的聚类算法。
(2)聚类
(3)K-Mean均值算法
2 K-Mean均值算法
2.1 引入
K- 均值 是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的
组
步骤:
- 设定 K 个类别的中心的初值;
- 计算每个样本到 K个中心的距离,按最近距离进行分类;
- 以每个类别中样本的均值,更新该类别的中心;
- 重复迭代以上步骤,直到达到终止条件(迭代次数、最小平方误差、簇中心点变化率)。
- 下面是一个聚类示例:
K-means聚类算法
K-****均值算法的伪代码如下:
Repeat {
for i = 1 to m
c(i) := index (form 1 to K) of cluster centroid closest to x(i)
for k = 1