逻辑回归模型
一、模型用途:
一般用来:
通过一些用户个人信息,社会状态,信用历史,缴费信息等数据建立信用风险模型,来预测用户的违约概率。
信用风险一般有模型:Application模型, Behavior模型,Collection模型。
二、Logistic回归模型:
1、Logistic回归模型与线性回归模型区别
Logic回归模型:用来预测因变量是分类的模型。
线性回归模型:用来预测因变量是连续的模型。
在本案例中因变量只有违约或不违约,转化成数字变量只有1或0,若使用最小二乘法则无法解释预测结果中随机出现的不是1和0的值,eg: 1.5,-0.3 等值。 且因为因变量分类类型较少,无法保证正态分布。
2、Logistic变换:将预测概率进行logic转换
i:指个体观察案例
P_i:指第i个案例一个事件中发生的概率
3、模型评估
a、评估方式
样本内评估:利用样本内的同期数据进行验证
样本外评估:利用样本外下一期的数据进行验证
b、评估指标
|预测类型|统计量|
|决策型 |准确率/误分类利润/成本|
|排序型 |ROC指标/Gini指数等|