贷款违约预测赛题理解

贷款违约预测赛题

赛题明显是个二分类问题,可能建立回归模型?判别贷款者是否会出现违约行为。

数据集中包含47个变量,其中32个有特征定义变量,15个匿名变量。

其中包含三个脱敏变量

赛题采用AUC作为评测指标,AUC是ROC曲线与x轴围城面积。ROC曲线横坐标为假正例率(FPR),纵坐标为正例率(TPR)。其中TPR定义为在所有实际为正例的样本中,被正确地判断为正例之比率。FPR定义为在所有实际为负例的样本中,被错误地判断为正例之比率。
roc.png

在模型中,我们需要设定不同的阈值score作为预测点分类判别标准。如设置score为0.6,若预测点概率值大于等于0.6,则判别为正类,设值为1,否则判别为负类设值为0。然后得到相应的TPR,FPR。通过设置不同的score,我们得到一系列的TPR与FPR值。将这些画成ROC曲线。

根据定义,当AUC等于一时,证明曲线过(0,1)点,因此模型存在一个score使得模型分类完美。当0.5<AUC<1,优于随机分类;AUC=0.5,等同于随机分类;AUC<0.5,差于随机分类。因此AUC越逼近于1,模型分类效果越好。

其中分类问题回归建模可参考https://blog.csdn.net/weixin_43630413/article/details/103504704

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值