目录
常见的分类方法有:逻辑斯谛回归(logistic)、线性判别分析(LDA)和K最近邻(KNN)。
一、逻辑斯谛回归(logistic)
逻辑斯谛回归对Y属于某一类的概率建模而不直接对响应变量建模。
1、Logistic模型
(1)概率
(2)逻辑斯谛函数
其中,p(X)/[1-p(X)]的值称为发生比,取值范围为0到∞,其值接近于0表示违约概率非常低,接近于∞则表示违约概率非常高。对数变化后,等式左边为对数发生比或分对数,即逻辑斯谛回归模型为分对数变换下关于X的一个线性模型。
(3)注意
- 在逻辑斯谛回归模型中,X每增加一个单位,对数发生比的变化为β1,发生比的变化乘以;
- 当β1>0时,P(X)随X的增加而增加;当β1<0时,P(X)随X的增加而减少。
2、估计回归系数
(1)方法:极大似然估计
(2)似然函数
对数变换将连乘转化为累加求和,便于计算。