第三章
聚类分析
1
、聚类分析的基本思想和功能是什么?
聚类分析的核心思想是根据具体的指标(变量)对所研究的个体或者对象进行分类,使得同一类
中的对象之间的相似性比其他类的对象的相似性更强。
聚类分析不仅可以用来对样品进行分类,
也可
以用来对变量进行分类。对样品的分类常称为
Q
型聚类分析,对变量的分类常称为
R
型的聚类分析。
聚类分析的目的或功能就是把相似的研究对象归成类,
即使类间对象的同质性最大化和类与类间
对象的异质性最大化。
2
、试述系统聚类法的原理和具体步骤
(
1
)系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过
程一直进行下去,每个样品(或变量)总能聚到合适的类中。
(
2
)系统聚类的具体步骤:假设总共有
N
个样品(或变量)
第一步:将每个样品(或变量)独自聚成一类,共有
N
类;
第二步:根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为
一类,其他的样品(或变量)仍各自聚为一类,共聚成
N-1
类;
第三步:将“距离”最近的两个类进一步聚成一类,共聚成
N-2
类;。。。,以上步骤一直进行
下去,最后将所有的样品(或变量)全聚成一类。
3
、试述
K-
均值聚类的方法原理
这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中。
首先随机从数据集中选取
K
个点作为初始聚类中心,
然后计算各个样本到聚类中的距离,
把样本
归到离它最近的那个聚类中心所在的类。
计算新形成的每一个聚类的数据对象的平均值来得到新的聚
类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。
第四章
判别分析
1
、应用判别分析应该具备什么样的条件?
判别分析最基本的要求是:分组类型在两组以上;每组案例的规模必须至少在一个以上;解释变
量必须是可测量的,才能够计算其平均值和方差,使其能合理地应用于统计函数。
2
、试述贝叶斯判别法的思路
思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得
一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后
验概率分布来进行。将贝叶斯思想用于判别分析,就得到贝叶斯判别。
3
、试述费歇判别方法的思想。
费歇判别的思想是投影,将
K
组
P
维数据投影到某一个方向,使得它们的投影组和组之间尽可能
地分开。
5
、简要叙述判别分析的步骤及流程。