应用多元统计分析课后答案
第五章
聚类分析
5.1
判别分析和聚类分析有何区别?
答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有
n
个样本,对每
个样本测得
p
项指标(变量)的数据,已知每个样本属于
k
个类别(或总体)中的某一类,
通过找出一个最优的划分,
使得不同类别的样本尽可能地区别开,
并判别该样本属于哪个总
体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知
道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别
分析是在已知有多少类及是什么类的情况下进行分类,
而聚类分析是在不知道类的情况下进
行分类。
5.2
试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,
过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
5.3
对样品和变量进行聚类分析时,
所构造的统计量分别是什么?简要说明为什么这样构
造?
答:
对样品进行聚类分析时,
用距离来测定样品之间的相似程度。
因为我们把
n
个样本看作
p
维空间的
n
个点。点之间的距离即可代表样品间的相似度。常用的距离为