聚类分析理论阐述
#理论参考
何晓群.多元统计分析(第五版)[M].北京:中国人民大学出版社
获取试卷:关注公众号回复:聚类分析试卷
1.聚类分析思想(简答)
聚类分析认为所研究的样品或指标之间存在不同程度的相似性,根据一批样品的多个观察指标,找到一些能够度量样品或指标之间的统计量,把这些统计量所谓划分类型的依据,把相似程度较大的样品聚合为一类,把相似程度较大的另外一类样品聚为另一类,关系密切的聚合到一个小的分类单位里,关系疏远的聚合到另一个大的分类单位里,直到把所有的样品或指标都聚合完毕,把不同类型的一一划分出来,形成一个有小到大的分类系统,最后把整个分类系统化成一张分群图,用它把样品或指标之间的亲疏关系表现出来。
对样品进行聚类分析时,要注意样品的数据类型,对定性的数据所做的分类常常分为Q型聚类分析,对变量的分类常称为R型聚类分析。
聚类分析的目的,是将相似的样品(研究对象)聚成类,使类内对象的同质性最大化和类与类之间的对象异质性最大化。
2.相似性度量
通过计算样本间的统计距离,进行相似度的度量。
3.统计距离的分类
衡量样品是否能分为同一类的指标