matlab编写k均值算法,K均值聚类算法的MATLAB实现 - 全文

最新推荐文章于 2024-07-09 20:42:06 发布

兔子313

最新推荐文章于 2024-07-09 20:42:06 发布

阅读量7.2k

点赞数 3

文章标签： matlab编写k均值算法

本文详细介绍了K-means聚类算法的原理和步骤，包括初始化、迭代更新以及聚类中心的计算。并通过MATLAB实现了一个简单的K-means算法，展示了算法在数据分类过程中的工作情况。此外，还讨论了算法可能面临的问题及其解决方法，并介绍了MATLAB内置函数Kmeans的使用方法和参数设置。

摘要由CSDN通过智能技术生成

K-means算法是最简单的一种聚类算法。算法的目的是使各个样本与所在类均值的误差平方和达到最小(这也是评价K-means算法最后聚类效果的评价标准)

K-means聚类算法的一般步骤：

初始化。输入基因表达矩阵作为对象集X，输入指定聚类类数N，并在X中随机选取N个对象作为初始聚类中心。设定迭代中止条件，比如最大循环次数或者聚类中心收敛误差容限。

进行迭代。根据相似度准则将数据对象分配到最接近的聚类中心，从而形成一类。初始化隶属度矩阵。

更新聚类中心。然后以每一类的平均向量作为新的聚类中心，重新分配数据对象。

反复执行第二步和第三步直至满足中止条件。

K-均值聚类法的概述

之前在参加数学建模的过程中用到过这种聚类方法，但是当时只是简单知道了在matlab中如何调用工具箱进行聚类，并不是特别清楚它的原理。最近因为在学模式识别，又重新接触了这种聚类算法，所以便仔细地研究了一下它的原理。弄懂了之后就自己手工用matlab编程实现了，最后的结果还不错，嘿嘿~~~

简单来说，K-均值聚类就是在给定了一组样本(x1， x2，。。.xn) (xi， i = 1， 2，。。。 n均是向量) 之后，假设要将其聚为 m(《n) 类，可以按照如下的步骤实现：

Step 1：从 (x1， x2，。。.xn) 中随机选择 m 个向量(y1，y2，。。.ym) 作为初始的聚类中心(可以随意指定，不在n个向量中选择也可以);

Step 2：计算 (x1， x2，。。.xn) 到这 m 个聚类中心的距离(严格来说为 2阶范数);

Step 3：对于每一个 xi(i = 1，2，。。.n)比较其到 (y1，y2，。。.ym) 距离，找出其中的最小值，若到 yj 的距离最小，则将 xi 归为第j类;

Step 4： m 类分好之后，计算每一类的均值向量作为每一类新的聚类中心;

Step 5：比较新的聚类中心与老的聚类中心之间的距离，若大于设定的阈值，则跳到 Step2; 否则输出分类结果和聚类中心，算法结束。

单介绍下kmeans算法流程：

假设要把样本集分为c个类别，算法描述如下：

(1)适当选择c个类的初始中心；

(2)在第k次迭代中࿰

最低0.47元/天解锁文章

关注

3
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。