对于C-Means,实质也是一个对样本的分类,最初我以为是对特征的分类,让我吃了很多苦!!
一、C-Means的原理:
二、matlab实现代码
%% C_menans
clear ;clc;
male_data = importdata('male.txt');
male_av = mean(male_data);
female_data = importdata('female.txt');
female_av = mean(female_data);
x = [male_data;female_data];
%plot(x(:,1),x(:,2),'.');
k = 2;
%取初值
m = zeros(k,2);
m = [160,50;176,68]; %c==2
% m = [male_av;female_av];
m_ref = zeros(k,2);
data_ad_la = zeros(length(x),1);
value =zeros(k,1);%记录每个类别样本的值,第一列是值,第二列是类别
w_num = zeros(k,1);%每一类的个数
x_temp =zeros(k,1);
hei = zeros(k,1);
wei = zeros(k,1);
%还要改这里
s1 = [];s2 = [];
while ( norm(m-m_ref)>0.0001 )
m_ref = m;
for i=1:length(x)
for j=1:k
x_temp(j) = norm(x(i,:) -m(j,:) ); %1*2-1*2
end
[A,B] = min(x_temp);
data_ad_la(i) = B;
hei(B) = hei(B) +x(i,1);
wei(B) = wei(B) +x(i,2);
value(B) = value(B)+A; %每一个类别都有个距离的和
%类别个数不同,这里要改改
if(B==1)
s1 = [s1,i];
else
s2 = [s2,i];
end
end
for i = 1:k
w_num(i) = sum(data_ad_la==i);
m(i,:) = [hei(i)/w_num(i),wei(i)/w_num(i)];
end
Je = sum( value./w_num );
value = zeros(k,1);
hei =zeros(k,1);
wei = zeros(k,1);
% s1 = [];s2 = [];
end
figure;
% plot(x(s1,1),x(s1,2),'*',x(s2,1),x(s2,2),'o',x(s3,1),x(s3,2),'+');legend('类1','类2','类3');title('C=3时的分类');
plot(x(s1,1),x(s1,2),'*',x(s2,1),x(s2,2),'o');legend('类1','类2');
% title('C=2时的分类,初值:m = [160,53;178,70];');
fprintf(' Je is %f',Je);
测试结果:
改变类别数,分别进行两类、三类、四类、五类聚类:
注:这里的这个图像我是通过Je/(聚类个数)得到的,按理说随着聚类个数的增加,Je应该会变小,可能代码有问题,还请大家指正
:
结论:随着聚类个数的增加,其Je会减小,但不会无限制的减小。聚类的结果还收初始聚类中心的影响。