分类模型是什么
分类模型分为判别分析和聚类分析。
判别分析是在已知研究对象分成若干类型并已经取得各种类型的一批已知样本的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析。
聚类分析则是给定的一批样品,要划分的类型实现并不知道,正需要通过局内分析来给以确定类型的。
判别分析
- 距离判别法:基本思想是首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第 i i i类的重心距离最近,就认为它来自第 i i i类。至于距离的测定,可以根据实际需要采用欧氏距离、马氏距离、明科夫距离等。
- Fisher判别法
- Bayes判别法
- 逐步判别法
聚类分析
- 系统聚类法(分层聚类法) 基本思想:开始将每个样本自成一类;然后求两两之间的距离,将距离最近的两类合成一类;如此重复,直到所有样本都合为一类为止。适用范围:既适用于样本聚类,也适用于变量聚类。
- 快速聚类法( K-均值聚类法) 基本思想:按照指定分类数目 n n n,选择n个初始聚类中心 Z i ( i = 1 , 2 , ⋯ , n ) Z_i(i= 1,2,\cdots,n) Zi(i=1,2,⋯,n);计算每个观测量(样本)到各个聚类中心的距离,按照就近原则将其分别分到放入各类中;重新计算聚类中心,继续以上步骤;满足停止条件时( 如最大迭代次数等)则停止。使用范围:要求用户给定分类数目 n n n,只适用于样本聚类( Q Q Q型),不适用于变量聚类( R R R型)。