SPSS系统发育分析中的聚类相关part

聚类分析本质上需要在特定坐标空间(某种变换坐标系下,比如说是PCA的PC空间)下计算距离矩阵,

距离的定义本身就是依据特定坐标变换(仿射变换)而定义的,

聚类分析的核心就是计算sample之间的距离。

此处已经提供了距离矩阵,所以直接

在“变量视图”中创建6个数值变量,分别命名为属1、属2、属3、属4、属5、属6

获取新坐标系:

然后就是系统聚类分析中可以选择选项:


比如说是质心法、ward法等;

(1)如果是中间距离,那均值度量有mean、median,我们可以选择中位数:

(2)如果使用重心法:

(3)如果使用ward法:

(4)如果是k-means

1个聚了4类,另外一个是2类,其实就是决策树中间的叶节点(或者说不同层次合并上的非根节点),其实还是能够看出来点层次的,需要不断调整

实际上这里有个超参数,就是指定聚类的数目是多少个,而且是非层次化的聚类,不适合于系统发生分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值