python 变量聚类 proc varclus_使用SAS进行简单的聚类分析讲解(转载)

本文介绍了SAS中用于R型聚类分析的PROC VARCLUS过程,通过实例详细解释了如何进行变量聚类,并展示了结果的解释,帮助理解如何分析数据的特征并进行聚类划分。
摘要由CSDN通过智能技术生成

聚类分析的目的是把分类对象按一定的规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何的假定。在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同类里的对象倾向于彼此不相似。

聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q型聚类是指对样品进行聚类,R型聚类分析是指对变量进行聚类。

SAS中用于判别分析的过程主要有以下四个:

PROC CLUSTER 谱系聚类(Q型聚类分析)

PROC FASTCLUS K均值快速聚类,适用于大样本(Q型聚类分析)

PROC MODECLUS 非参数聚类(Q型聚类分析)

PROC VARCLUS 变量聚类(R型聚类分析)

1. 用PROC CLUSTER进行样品聚类分析(Q型聚类分析)

[例1]试根据1997年信息基础设施的发展情况,对世界20个国家和地区进行聚类分析。描述信息基础设施的变量主要有六个:

Cal-每千人拥有电话线数;

Cellphone-每千户居民移动电话数;

Fee-高峰时期每三分钟国际电话成本;

Computer-每千人拥有的计算机数;

Mips-每千人中计算机功率(每秒百万指令);

Net-每千人互联网络户主数。

data cluster1;

infile datalines;

input Country $ Cal Cellphone Fee Computer Mips Net;

datalines;

美国 631.6 161.9 0.36 403 26073 35.34

日本 498.4 143.2 3.57 176 10223 6.26

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值