一、前言
这篇文章复盘分类模型。对于二分类模型,本文介绍逻辑回归和Fisher线性判别分析两种分类算法;对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤
利用spass软件对数据进行预处理:生成虚拟变量
1.生成虚拟变量
2.删除多余虚拟变量
3.修改虚拟变量的名称
二、逻辑回归的原理
从宏观上分析,逻辑回归就是在原来回归思想上,添加了一个连接函数
问题分析的角度:对于因变量为分类变量的情况,可以使用逻辑回归来进行处理,即把y看成是事件发生的概率,y >= 0.5 表示事件发生; y <= 0.5表示事件不发生
2.1线性概率模型
直接用原来的回归模型进行归回分析
回归形式:
模型问题一:内生性问题
模型问题二:预测值不现实问题
2.2连接函数
用两点分布(伯努利分布)介绍连接函数的概念
2.3回归模型中连接函数的取法
回归模型中连接函数应该满足的条件:
连接函数取法一:可以取为标准正态分布的累积密