K-means聚类【数学建模】

K-means(K-均值聚类算法)是划分聚类分割的方法,将一个有N个元组或记录的数据集,分裂成K个分组,每个分组就是一个聚类,K<N,每个分组满足:

        1.每个分组至少包含一个数据记录

        2.每个数据记录属于且仅属于一个分组

算法步骤:

1.任意选择k个对象作为初始聚类中心

2.计算每个对象与聚类中心的距离,并根据最小距离重新划分

3.重新计算聚类中心,直到聚类中心不再变化,这种划分使得下式最小:E = \sum_{j=1}^{k}\sum_{xi\in wj}\left \| xi-mj \right \|^{2}

xi为第i样本点的位置;mj为第j个聚类中心的位置。

4.循环2 3 步,直到聚类中心不再改变。

特点:

采用两阶段反复循环过程算法

结束条件:不再有数据元素被重新分配

matlab代码:

%% 数据准备和初始化
clc
clear
x=[0 0;1 0; 0 1; 1 1;2 1;1 2; 2 2;3 2; 6 6; 7 6; 8 6; 6 7; 7 7; 8 7; 9 7 ; 7 8; 8 8; 9 8; 8 9 ; 9 9];
z=zeros(2,2);
z1=zeros(2,2);
z=x(1:2, 1:2);
%% 寻找聚类中心
while 1
    count=zeros(2,1);
    allsum=zeros(2,2);
    for i=1:20 % 对每一个样本i,计算到2个聚类中心的距离
        temp1=sqrt((z(1,1)-x(i,1)).^2+(z(1,2)-x(i,2)).^2);
        temp2=sqrt((z(2,1)-x(i,1)).^2+(z(2,2)-x(i,2)).^2);
        if(temp1<temp2)
            count(1)=count(1)+1;
            allsum(1,1)=allsum(1,1)+x(i,1);
            allsum(1,2)=allsum(1,2)+x(i,2);
        else
            count(2)=count(2)+1;
            allsum(2,1)=allsum(2,1)+x(i,1);
            allsum(2,2)=allsum(2,2)+x(i,2); 
        end
    end
    z1(1,1)=allsum(1,1)/count(1);
    z1(1,2)=allsum(1,2)/count(1);
    z1(2,1)=allsum(2,1)/count(2);
    z1(2,2)=allsum(2,2)/count(2);
    if(z==z1)
        break;
    else
        z=z1;
    end
end
%% 结果显示
disp(z1);% 输出聚类中心
plot( x(:,1), x(:,2),'k*',...
    'LineWidth',2,...
    'MarkerSize',10,...
    'MarkerEdgeColor','k',...
    'MarkerFaceColor',[0.5,0.5,0.5])
hold on
plot(z1(:,1),z1(:,2),'ko',...
    'LineWidth',2,...
    'MarkerSize',10,...
    'MarkerEdgeColor','k',...
    'MarkerFaceColor',[0.5,0.5,0.5])
set(gca,'linewidth',2) ;
xlabel('特征x1','fontsize',12);
ylabel('特征x2', 'fontsize',12);
title('K-means分类图','fontsize',12);

 

 

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
K-means聚类在SPSS中的应用是相对常见的。SPSS是一款统计软件,可以用于数据分析和建模。在SPSS中,使用K-means聚类可以对数据进行聚类分析,并且可以帮助我们发现数据中的隐藏模式和结构。 具体在SPSS中使用K-means聚类步骤如下: 1. 准备好待分析的数据集。将需要进行聚类分析的变量导入SPSS。 2. 打开SPSS软件,在菜单栏选择"分析",然后选择"聚类",再选择"K-means聚类"。 3. 在弹出的窗口中,选择需要进行聚类分析的变量,并设置聚类的参数,例如要分成几个簇,设置初始聚类中心的选择方等。 4. 点击"确定"按钮,SPSS会自动进行K-means聚类分析,并将结果输出。 5. 分析结果会显示每个数据点所属的簇的编号,以及每个簇的中心点的坐标等信息。 值得注意的是,K-means聚类在选择初始聚类中心时,一般遵循的基本原则是初始聚类中心之间的相互距离要尽可能的远。这样可以确保最终的聚类结果更加准确。 总结起来,K-means聚类在SPSS中可以有效地对数据进行聚类分析,并且可以帮助我们发现数据中的隐藏模式和结构。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [清风数学建模学习笔记——K-means聚类模型详解及SPSS操作流程](https://blog.csdn.net/weixin_43819566/article/details/113794705)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [聚类K-means聚类与系统(层次)聚类SPSS操作](https://blog.csdn.net/yanyanwenmeng/article/details/105794136)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值