k-means聚类算法

最新推荐文章于 2024-08-28 16:05:19 发布

_啊哈

最新推荐文章于 2024-08-28 16:05:19 发布

阅读量1.2k

点赞数

分类专栏：常用算法

常用算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

k-means算法：

第一步：选

K K 个初始聚类中心，

z1(1),z2(1),⋯,zk(1) z1(1),z2(1),⋯,zk(1) ，其中括号内的序号为寻找聚类中心的迭代运算的次序号.

聚类中心的向量值可任意设定，例如可选开始的 K 个模式样本的向量值作为初始聚类中心。

第二步：逐个将需分类的模式样本

{x} {x} 按最小距离准则分配给

K K 个聚类中心中的某一个

zj(1) zj(1) 。假设

i=j i=j 时，

D j (k) = min {∥ x - z i (k) ∥, i = 1, 2, \dots K}

则 x∈Sj(k) ，其中 k 为迭代运算的次序号，第一次迭代 k=1 ， Sj 表示第 j 个聚类，其聚类中心为 zj 。

第三步：计算各个聚类中心的新的向量值， zj(k+1),j=1,2,⋯,K ，求各聚类域中所包含样本的均值向量：

z j (k + 1) = 1 N j \sum x \in S j (k) x, j = 1, 2, \dots, K,

其中 Nj 为第 j 个聚类域 Sj 中所包含的样本个数。以均值向量作为新的聚类中心，可使如下聚类准则函数最小：

J j = \sum x \in S j (k) ∥ x - z j (k + 1) ∥ 2, j = 1, 2, \dots, K

在这一步中要分别计算 K 个聚类中的样本均值向量，所以称之为 K -均值算法。

第四步：若 zj(k+1)≠zj(k),j=1,2,⋯,K ，则返回第二步，将模式样本逐个重新分类，重复迭代运算；若 zj(k+1)=zj(k),j=1,2,⋯,k ，则算法收敛，计算结束。

K-均值分类算法实例

第一步：取 K=2 ，并选

z1(1)=x1=(00)T,z2(1)=x2=(10)T

第二步：因 ||x1−z1(1)||<||x1−z2(1)|| ，故 x1∈S1(1)

因 ||x2−z1(1)||>||x2−z2(1)|| ，故 x2∈S2(1)

因 ||x3−z1(1)||<||x3−z2(1)|| ，故 x3∈S1(1)

……

得到：

S₁(1)={x₁, x₃}, S₂(1)={x₂, x₄, x₅, …, x₂₀}

第三步：计算新的聚类中心

第四步：因 zj(2)≠zj(1),j=1,2 ，返回第二步；

第二步（返回1）：由新的聚类中心，得到：

因此

S1(2)={x1,x2,⋯,x8}

S2(2)={x9,x10,⋯,x20}

第三步（返回1）：计算聚类中心

第四步（返回1）：因 zj(3)≠zj(2),j=1,2 ，返回第二步；

第二步（返回2）：分类结果与前一次迭代的结果相同，即 S1(4)=S1(3)，S2(4)=S2(3) ；

第三步（返回2）：聚类中心与前一次迭代的结果相同；

第四步（返回2）：因 zj(4)=zj(3),j=1,2 ，算法收敛，得到最终的聚类中心。

,

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。