目录
简介
对于二分类问题,将种类,即因变量分为0和1两种数值变量,从已有的数据中找到因变量和自变量的回归方程,预测出因变量的值,与0更接近还是与1更接近来进行分类,即Logistic回归;对于已有的数据,试图找到一个超平面将数据点分割开,且数据点在该超平面上的投影收敛,并且与另一组点到该超平面上的投影相隔甚远,即Fisher线性判别。推而广之,可以用Logistic回归和Fisher线性判别进行多分类问题。
Logistic回归
数学原理
考虑线性概率回归模型,记为
.
由于自变量y代表y=1,即分到1类的概率,故需要将因变量y的值划归到0~1区间上,定义为一个连接函数,连接函数通常取Sigmoid函数,即
SPSS应用
为种类创建虚拟变量
进行二元Logistic回归
分析结果
Fisher线性判别
SPSS操作
定义分组变量的范围