客户信用风险预测——基于logit模型

这篇博客介绍了如何利用R语言的logit模型来预测客户信用风险,包括数据预处理、变量筛选、建模、结果分析和参数优化。通过模型,我们可以得到客户违约的概率,并通过调整临界概率优化预测精度。
摘要由CSDN通过智能技术生成

线性回归是最基本的统计模型之一,通常用于衡量数值型变量间的线性关系,当解释变量或者被解释变量为分类型变量时,就不再适用,需要考虑设置虚拟变量或是选择其它分类模型。

下面介绍一个二元选择模型,此时被解释变量是分类变量,取值为0(不发生)或者1(发生)。

数据来源于《R数据分析:方法与案例详解》,借助logit模型测算客户违约概率,完成信用风险评估。具体分为5个步骤:数据预处理——变量筛选——建模——结果分析——参数优化。

  1. 数据预处理
    案例数据来源于台湾某大型商业银行信用卡部的数据库,包含16000条信息 ,29 个变量,即客户基本信息(性别*、年龄*、城镇或农村*、学历*、职业*、婚姻*、家庭人数*、 户籍所在地、宗教、血型、星座) ,经济状况(家庭月收入*、家庭经济等级*、个人月收入*、个人月开 销*),信用卡使用状况(信用卡张数*、使用频率*、月刷卡金额*),信用记录(逾期超过 30 天*、呆账记 录*、借款余额大于 800 万元*、退票记录、拒往记录、强制停卡记录)。

缺失值处理(因为含NA的样本数量很少,直接删去)

变量重编码(连续数据离散化、字符型变量数值化)

在这里插入图片描述

  • 2
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值