聚类分析的目的是把分类对象按一定的规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何的假定。在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同类里的对象倾向于彼此不相似。
聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q型聚类是指对样品进行聚类,R型聚类分析是指对变量进行聚类。
聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q型聚类是指对样品进行聚类,R型聚类分析是指对变量进行聚类。
SAS中用于判别分析的过程主要有以下四个:
PROC CLUSTER 谱系聚类(Q型聚类分析)
PROC FASTCLUS K均值快速聚类,适用于大样本(Q型聚类分析)
PROC MODECLUS 非参数聚类(Q型聚类分析)
PROC VARCLUS 变量聚类(R型聚类分析)
1. 用PROC CLUSTER进行样品聚类分析(Q型聚类分析)
[例1]
试根据1997年信息基础设施的发展情况,对世界20个国家和地区进行聚类分析。描述信息基础设施的变量主要有六个:
Cal-每千人拥有电话线数;
Cellphone-每千户居民移动电话数;
Fee-高峰时期每三分钟国际电话成本;
Computer-每千人拥有的计算机数;
Mips-每千人中计算机功率(每秒百万指令);
Net-每千人互联网络户主数。
data cluster1;
infile datalines;
input Country $ Cal Cellphone Fee Computer Mips Net;
datalines;
美国 631.6
聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q型聚类是指对样品进行聚类,R型聚类分析是指对变量进行聚类。
聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q型聚类是指对样品进行聚类,R型聚类分析是指对变量进行聚类。
SAS中用于判别分析的过程主要有以下四个:
PROC CLUSTER 谱系聚类(Q型聚类分析)
PROC FASTCLUS K均值快速聚类,适用于大样本(Q型聚类分析)
PROC MODECLUS 非参数聚类(Q型聚类分析)
PROC VARCLUS 变量聚类(R型聚类分析)
1. 用PROC CLUSTER进行样品聚类分析(Q型聚类分析)
[例1]
试根据1997年信息基础设施的发展情况,对世界20个国家和地区进行聚类分析。描述信息基础设施的变量主要有六个:
Cal-每千人拥有电话线数;
Cellphone-每千户居民移动电话数;
Fee-高峰时期每三分钟国际电话成本;
Computer-每千人拥有的计算机数;
Mips-每千人中计算机功率(每秒百万指令);
Net-每千人互联网络户主数。
data cluster1;
infile datalines;
input Country $ Cal Cellphone Fee Computer Mips Net;
datalines;
美国 631.6