Kmeans算法在MATLAB中的实现及实例

最新推荐文章于 2025-03-14 15:24:37 发布

waitingwinter

最新推荐文章于 2025-03-14 15:24:37 发布

阅读量1.1w

点赞数 15

分类专栏：深度学习与机器学习文章标签：聚类 matlab kmeans算法

本文链接：https://blog.csdn.net/waitingwinter/article/details/105321891

版权

基本思想

K-means 是一种基本的、经典的聚类方法，也被称为K-平均或K-均值算法，是一种广泛使用的聚类算法。K-Means算法是聚焦于相似的无监督的算法，以距离作为数据对象间相似性度量的标准，即数据对象间的距离越小，则它们的相似性越高，则它们越有可能在同一个类簇。其算法具体的步骤为 Algorithm1
其中， $n$ 为样本数， $\mu_i$ 为聚类中心(Clustering Center), $c$ 为聚类类别数量。
下面我们通过一个具体的例子来体会体会其思想，进而得到一般化的程序。

一个简单的例子

假定我们现有数据集

% data set;
Sigma = [1, 0; 0, 1];
mu1 = [1, -1];
x1 = mvnrnd(mu1, Sigma, 200);
mu2 = [5, -4];
x2 = mvnrnd(mu2, Sigma, 200);
mu3 = [1, 4];
x3 = mvnrnd(mu3, Sigma, 200);
mu4 = [6, 4];
x4 = mvnrnd(mu4, Sigma, 200);
mu5 = [7, 0.0];
x5 = mvnrnd(mu5, Sigma, 200);

其中每个 $x_i$ 对应着一个类别标签，即

X = [x1; x2; x3; x4; x5];
X_label = [ones(200, 1); 2 * ones(200, 1); 3 * ones(200,1); 4 * ones(200, 1);5 * ones(200, 1)];

我们可以从图中看到数据的大致分布

% Show the data points 
plot(x1(:,1), x1(:,2), 'r.'); hold on;
plot(x2(:,1), x2(:,2), 'b.');
plot(x3(:,1), x3(:,2), 'k.');
plot(x4(:,1), x4(:,2), 'g.');
plot(x5(:,1), x5(:,2), 'm.');