对于二分类模型,我们将介绍逻辑回归(logistic regression)和Fisher线性判别分析两种分类算法;对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤。
目录
二分类模型
逻辑回归(logistic regression)
1.若有定性变量,先预处理成虚拟变量
用spss
2.y为二值变量用逻辑回归
1)线性概率模型(出现不现实的情况)
2) 两点分布(伯努利分布)
基本思路: 连续函数取法(一般使用logistic回归,模型简单)
求解:用极大值估计->B^->y^->判断与0.5大小
若线性用最小二乘法
非线性用极大值法
结果分类(与0.5对比) 没有考虑交互项
求解步骤:spss结果一般看块一->预测成功率
预测成功率
逻辑回归系数表
逐步回归(会删除自变量,可能产生内生性)
创建虚拟变量一般用(2)
预测结果较差,但会产生过拟合问题(类似龙格现象,显著性不好)
补:显著性检验:用于检验实验组与对照组之间是否有差异以及差异是否显著 过拟合改进
清空测试组数据之后与预测结果进行对比
Fisher线性判别分析
核心问题:找到线性系数向量w
spss操作
结果分析蓝色区域放入论文
多分类问题
Fisher判别分析
Fisher判别分析多分类的结果
Logistic回归
spss操作
结果说明