k-means聚类算法的python实现和sklearn的聚类器
文章目录
k-means聚类算法的python实现和sklearn的聚类器1. 标准k-means聚类算法2. sklearn.cluster.KMeans
1. 标准k-means聚类算法
k-means是一个迭代算法,需要人为指定聚类数量。因为实现简单、对大样本有很好的拓展性被广泛采用。 算法初始化阶段首先随机选取不重复的
k
k
k个点作为 初始的聚类中心(称为Centroid)。不断重复执行以下两个步骤:
给每个点
x
i
x_i
xi分配所属类别
l
i
l_i
li
l
i
=
a
r
g
m
i
n
j
{
d
(
x
i
,
μ
j
)
}
l_i=\mathop{argmin}_{j}\{d(x_i,\mu_j)\}
li=argminj{d(xi,μj)}根据分配结果重新计算每个聚类的均值
μ
j
=
1
{
l
i
=
j
}
x
i
1
{
l
<