matlab princomp_MATLAB数据分析,基于14种不同的聚类分析方法

聚类分析算法

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,通常,模式是一个度量的向量,聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。

对于聚类算法,大多数用SPSS软件实现,通常导入数据,并且选择聚类方法即可实现,本节借用MATLAB软件,基于14种不同的聚类分析方法,实现样品聚类。

14种聚类方法

(1)最长距离法

X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'euclid');M=squareform(D);Z=linkage(D,'complete');H=dendrogram(Z);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
e461ca89d044562ce0fccc6b9f9dabdc.png

(2) 最短距离法

X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'euclid');M=squareform(D);Z=linkage(D,'single');H=dendrogram(Z);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,'cutoff',0.8);
ec40b28a1c2d8d289633cccedcb29aa8.png

(3)综合聚类子程序

X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];T=clusterdata(X,0.8);Re=find(T=5)

(4)重心法&标准欧氏距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'seuclid');M=squareform(D);Z=linkage(D,'centroid');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
c2cdcf5ad7b0b0c21aea887a2e29fa52.png

(5)重心法&欧氏距离平方

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'euclid');D2=D.^2;M=squareform(D2);Z=linkage(D2,'centroid');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D2);T=cluster(Z,3);
25ff69396848f4af83df43ceaff58a08.png

(6)重心法&精度加权距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];[n,m]=size(X);stdx=std(X);X2=X./stdx(ones(n,1),:);D=pdist(X2,'euclid');M=squareform(D);Z=linkage(D,'centroid');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
8bf96fab7138ca80caa4fec31e36d1af.png

(7)最短距离法&基于主成分的标准欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];[E,score,eigen,T]=princomp(X);D=pdist(score,'seuclid');M=squareform(D);Z=linkage(D,'single');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
7e1ddd93db4b6f594b74a1ac6c127f3a.png

(8)平均法&标准欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'seuclid');M=squareform(D);Z=linkage(D,'average');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
2092c2e3ce4826ce9346dc5625c474d8.png

(9)权重法&标准欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'seuclid');M=squareform(D);Z=linkage(D,'weighted');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
44b9cd20111a931e7bdb2aa40d5b48d7.png

(10)最短距离法&马氏距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'mahal');M=squareform(D);Z=linkage(D,'single');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
bb49cb8220317059015d318947122616.png

(11)重心法&标准化数据的的欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];[n,m]=size(X);mv=mean(X);st=std(X);x=(X-mv(ones(n,1),:))./st(ones(n,1),:);D=pdist(X,'euclid');M=squareform(D);Z=linkage(D,'centroid');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
056c7857e37cc8da479fd96c5cb1b941.png

(12)最长距离法&欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'euclid');M=squareform(D);Z=linkage(D,'complete');[H tPerm]=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
8ec07b15d87aae0b9b238f78e8e1de9e.png

(13)平均法&相似系数

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];D=pdist(X,'cosine');M=squareform(D);Z=linkage(D,'centroid');T=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
5a2ca6e2521ab1208d4e21f536aa726b.png

(14)最短距离法&基于主成分的标准欧式距离

S=['福冈';'合肥';'武汉';'长沙';'桂林';'温州';'成都'];X=[16.21492 2000 -8.2 6.2;   15.7 970 2209 -20.6 1.9;   16.3 1260 2085 -17.3 2.8;   17.2 14221726 -9.5 4.6;   18.8 1874 1709 -4.9 8.0;   17.9 1698 1848 -4.5 7.5;   16.3 976 1239-4.6 5.6];[E,score,eigen,T]=princomp(X);PCA=[score(:,1),score(:,2)];D=pdist(PCA,'seuclid');M=squareform(D);Z=linkage(D,'single');H=dendrogram(Z,'labels',S);xlabel('City');ylabel('Scale');C=cophenet(Z,D);T=cluster(Z,3);
77669b63f89a89cba00c9af67f77a4fe.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值