聚类分析
1.什么是聚类分析
聚类分析是将个体或对象分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强。
2.目的
目的是把相似的研究对象归成类,使类内对象的同质性最大化和类与类间对象的异质性最大化。
3.聚类分析的基本思想
我们认为,所研究的样品或指标(变量)之间存在程度不同的相似性(亲疏关系)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量作为划分类型的依据,把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)聚合为另一类......关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏关系表示出来。
聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。
对样品分类