判别分析简介
判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。
当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题。
SPSS操作步骤
这里采用判别分析经典数据–鸢尾花数据。
- 导入数据后,依次点击分析->分类->判别式:
- 选择分组变量,并确定组数:
- 点击统计并进一步选择:
- 点击分类并进一步选择:
- 回到第2步界面,选择自变量并点击确定:
注意:这里选择步进法SPSS会判断哪些变量对分类有用并选择。
- 得到输出结果。
输出结果分析
-
基本数据输出:
-
典型判别函数分析:
上表说明,对于此次分析有两个判别函数。其中第一个判别函数的贡献达到了99.1%,第二个判别函数贡献只有0.9%。
上表对判别函数进行假设检验。其中原假设为判别函数i至判别函数n是否显著,显著性即为P值。对于此次分析,判别函数1和2在99%的置信度上显著。
标准化典型判别函数系数:
-
分类判别函数:
使用该表中系数计算得分取最大值确实组别。
-
典型判别函数分组图形:
-
分类结果:
分类结果表纵轴表示对组别的预测。如表第二行表示,对于第二组的50个数据使用判别函数进行预测,其中48个数据被正常分组,2个数据被错分到第3组,正确率为96%。