K-means聚类【数学建模】

最新推荐文章于 2023-04-24 21:01:29 发布

栗原小野

最新推荐文章于 2023-04-24 21:01:29 发布

阅读量2.4k

点赞数

分类专栏：数学建模文章标签：数学建模

本文链接：https://blog.csdn.net/weixin_43719720/article/details/102774764

版权

数学建模专栏收录该内容

3 篇文章 0 订阅

订阅专栏

K-means（K-均值聚类算法）是划分聚类分割的方法，将一个有N个元组或记录的数据集，分裂成K个分组，每个分组就是一个聚类，K<N,每个分组满足：

1.每个分组至少包含一个数据记录

2.每个数据记录属于且仅属于一个分组

算法步骤：

1.任意选择k个对象作为初始聚类中心

2.计算每个对象与聚类中心的距离，并根据最小距离重新划分

3.重新计算聚类中心，直到聚类中心不再变化，这种划分使得下式最小： $E = \sum_{j=1}^{k}\sum_{xi\in wj}\left \| xi-mj \right \|^{2}$

xi为第i样本点的位置；mj为第j个聚类中心的位置。

4.循环2 3 步，直到聚类中心不再改变。

特点：

采用两阶段反复循环过程算法

结束条件：不再有数据元素被重新分配

matlab代码：

%% 数据准备和初始化
clc
clear
x=[0 0;1 0; 0 1; 1 1;2 1;1 2; 2 2;3 2; 6 6; 7 6; 8 6; 6 7; 7 7; 8 7; 9 7 ; 7 8; 8 8; 9 8; 8 9 ; 9 9];
z=zeros(2,2);
z1=zeros(2,2);
z=x(1:2, 1:2);
%% 寻找聚类中心
while 1
    count=zeros(2,1);
    allsum=zeros(2,2);
    for i=1:20 % 对每一个样本i，计算到2个聚类中心的距离
        temp1=sqrt((z(1,1)-x(i,1)).^2+(z(1,2)-x(i,2)).^2);
        temp2=sqrt((z(2,1)-x(i,1)).^2+(z(2,2)-x(i,2)).^2);
        if(temp1<temp2)
            count(1)=count(1)+1;
            allsum(1,1)=allsum(1,1)+x(i,1);
            allsum(1,2)=allsum(1,2)+x(i,2);
        else
            count(2)=count(2)+1;
            allsum(2,1)=allsum(2,1)+x(i,1);
            allsum(2,2)=allsum(2,2)+x(i,2); 
        end
    end
    z1(1,1)=allsum(1,1)/count(1);
    z1(1,2)=allsum(1,2)/count(1);
    z1(2,1)=allsum(2,1)/count(2);
    z1(2,2)=allsum(2,2)/count(2);
    if(z==z1)
        break;
    else
        z=z1;
    end
end
%% 结果显示
disp(z1);% 输出聚类中心
plot( x(:,1), x(:,2),'k*',...
    'LineWidth',2,...
    'MarkerSize',10,...
    'MarkerEdgeColor','k',...
    'MarkerFaceColor',[0.5,0.5,0.5])
hold on
plot(z1(:,1),z1(:,2),'ko',...
    'LineWidth',2,...
    'MarkerSize',10,...
    'MarkerEdgeColor','k',...
    'MarkerFaceColor',[0.5,0.5,0.5])
set(gca,'linewidth',2) ;
xlabel('特征x1','fontsize',12);
ylabel('特征x2', 'fontsize',12);
title('K-means分类图','fontsize',12);

栗原小野

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
K-means聚类【数学建模】

K-means（K-均值聚类算法）是划分聚类分割的方法，将一个有N个元组或记录的数据集，分裂成K个分组，每个分组就是一个聚类，K<N,每个分组满足： 1.每个分组至少包含一个数据记录 2.每个数据记录属于且仅属于一个分组算法步骤：1.任意选择k个对象作为初始聚类中心2.计算每个对象与聚类中心的距离，并根据最小距离重新划分3.重新计算聚类中心...
复制链接

扫一扫