多元统计分析
聚类分析
基本思想 P42
目的:类内对象的同质性最大,类与类间的异质性最大
对象
Q型聚类分析:样品
R型聚类分析:变量
指标类型 间隔尺度,有序尺度,名义尺度
相似性度量
样品 明考斯基距离,兰氏距离,马氏距离
指标 夹角余弦,相关系数
方法
系统聚类法(层次聚类)——皆可
步骤
计算n个样品两两间的距离
构造n个类,每类只包含一个样品
合并距离最近的两类为一个新类
重新计算新类与当前各类的距离
重复进行步骤2.3,直至所有样品聚为一类
画聚类图,决定分类个数和类
距离定义 P53
最短距离法、最长距离法、重心法、类平均法、离差平方和法