spss 系统聚类里的组内连接法

做系统聚类时,spss 提供了好几种定义类距离的方法,其中,组间连接(between groups)就是教科书中的类平均法。

组内连接(within groups)一直没找到定义,用谷歌搜索了下,终于找到了一个资料:http://www.norusis.com/pdf/SPC_v13.pdf

组内连接的意思是:两个类中所有样品两两之间的距离平方和的均值。而组间连接只计算不同类中样品的距离,同类中样品之间的距离就不计算了。

假如有两个类 A 和 B,A 中包括样品 (1, 2),B 中包括样品(3, 4,5)。
若是组间连接,计算的距离有:(1,3),(1,4),(1,5),(2,3)(2,4),(2,5),然后取他们的平方和均值作为两类之间的距离。
若是组内连接,计算的距离有:(1,3),(1,4),(1,5),(2,3)(2,4),(2,5),(1,2),(3,4),(3,5),(4, 5)。然后取他们的平方和均值作为两类之间的距离。

可见,组内连接计算的更多。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心态与习惯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值