[Matlab] K均值聚类

最新推荐文章于 2022-08-13 19:35:50 发布

锡同

最新推荐文章于 2022-08-13 19:35:50 发布

阅读量953

点赞数 2

分类专栏：机器学习文章标签： matlab

本文链接：https://blog.csdn.net/zykimmy/article/details/51778227

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

算法参见

http://cs229.stanford.edu/notes/cs229-notes7a.pdf

function y=K_mean(data,k)
[r,c]=size(data);                                 
%r : 数据的总数
%c: 每个数据的特征的个数
initcen=ones(k,c);        %预分配initial center
initcen_cur=initcen;     %           current initial center
dis=ones(r,k);              %           distance
diff=ones(k,1);            
for i=1:k
    initcen(i,:)=data(ceil(r*rand),:);      %随机生成k个初始中心点,(在数据集中选取)
end
while sum(diff)>0.1
    for i=1:k
        initvec=ones(r,1)*initcen(i,:);                 %将k个中心点扩展为r*c的矩阵
        for j=1:r
            dis(j,i)=norm(data(j,:)-initvec(j,:));      %dis是r*k 矩阵，每个数据到每个中心点的距离
        end
    end
    [minval,tag]=min(dis');    %min按列找最小值
    data_tag=[data,tag'];      %给data增加一个tag的维度,即(c+1)列
    for i=1:k
         initcen_cur(i,:)=mean(data(find(data_tag(:,c+1)==i),:));
         diff(i,:)= sum(abs(initcen_cur(i,:)-initcen(i,:)));
    end
    initcen=initcen_cur;        %循环迭代
end
y=[initcen,[1:k]'];                 %第c+1列为最后收敛中心的标号

[100,3]=size(data)

k=3

数据测试

锡同

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
[Matlab] K均值聚类

算法参见http://cs229.stanford.edu/notes/cs229-notes7a.pdffunction y=K_mean(data,k)[r,c]=size(data); %r : 数据的总数%c: 每个数据的特征的个数initcen=ones(k,c); %预分配initia
复制链接

扫一扫