Logistic回归模型和Zeppelin简单使用

本文介绍了Logistic回归模型的用途、与线性回归的区别、Logistic变换以及模型评估方法,包括ROC曲线的绘制和AUC的解释。此外,还分享了在Zeppelin中使用Spark遇到的问题及解决办法,涉及Spark配置、数据读取和数据可视化操作。
摘要由CSDN通过智能技术生成

逻辑回归模型

一、模型用途:

一般用来:
通过一些用户个人信息,社会状态,信用历史,缴费信息等数据建立信用风险模型,来预测用户的违约概率。
信用风险一般有模型:Application模型, Behavior模型,Collection模型。

二、Logistic回归模型:

1、Logistic回归模型与线性回归模型区别

Logic回归模型:用来预测因变量是分类的模型。
线性回归模型:用来预测因变量是连续的模型。
在本案例中因变量只有违约或不违约,转化成数字变量只有1或0,若使用最小二乘法则无法解释预测结果中随机出现的不是1和0的值,eg: 1.5,-0.3 等值。 且因为因变量分类类型较少,无法保证正态分布。

2、Logistic变换:将预测概率进行logic转换

logistic转换方程
i:指个体观察案例
P_i:指第i个案例一个事件中发生的概率
这里写图片描述

Logistic模型介绍

3、模型评估
a、评估方式

样本内评估:利用样本内的同期数据进行验证
样本外评估:利用样本外下一期的数据进行验证

b、评估指标

|预测类型|统计量|
|决策型 |准确率/误分类利润/成本|
|排序型 |ROC指标/Gini指数等|

c、决策性评估

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值