Kmeans 聚类算法

为了实现BOW模型,需要Kmeans聚类算法,使用Matlab自带的聚类算法时,出现了不能收敛的问题,想要改进的话也是不方便。

于是决定动手编写一个,在编写过程中总是想不到怎样把同一类的样本聚在一起,这个问题困扰了自己很长的时间,终于在大牛人Rachel Zhang 的博客里面找到了解决的办法,就是下面这关键的一句,省去了很多麻烦。

[~,label(i)] = min(D);]

现把自己写的放到下面,一起进步。

tic
clear all;
clc;
load data/backpack.mat 
dat=backpack(:,2:size(backpack,2));
clear backpack
%%
K=20;%聚类数
Iter=150;%最大迭代次数
thresh=0;%阈值

[dat_row,dat_col]=size(dat);
% kCenter=zeros(K,dat_col);%聚类中心点
kIndex=randperm(dat_row,K);
kCenter=dat(kIndex,:);
%%

label=zeros(dat_row,1);

Mse=zeros(1,Iter);
iter=1;
czMse=thresh+1;
D=zeros(1,K);
while 1    
    %第一次迭代
        %第一此聚类
    for dat_row_=1:dat_row
        for K_=1:K
            D(K_)=norm(dat(dat_row_,:)-kCenter(K_,:));
        end
        [~,label(dat_row_)]=min(D);
    end
    clear dat_row_ K_ D
    %新的聚类中心
    tempEvalue=0;
    for K_=1:K
        tempClusterIndex= label==K_;
        if ~isempty(tempClusterIndex)
            tempCluster=dat(tempClusterIndex,:);
            kCenter(K_,:)=mean(tempCluster);
            tempClusterRow=size(tempCluster,1);
            for tempClusterRow_=1:tempClusterRow
                tempEvalue=tempEvalue+norm(tempCluster(tempClusterRow_,:)...
                    -kCenter(K_,:));
            end
        end        
    end
    clear K_ tempClusterIndex tempCluster tempClusterRow_ tempClusterRow
    Mse(iter)=tempEvalue;
    disp(iter);
    
    
    if iter>=2
        czMse=Mse(iter-1)-Mse(iter);
        disp(czMse);
    end
    iter=iter+1;
    
    if abs(czMse)<=thresh %达到阈值后跳出循环
        disp('kCenter Founded');
        break;
    elseif iter>Iter %达到最大迭代次数后跳出循环
        disp('kCenter not Founded')
        break;
    end

end
toc


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值