逻辑回归建立评分卡

最新推荐文章于 2024-05-15 11:39:35 发布

tour_ying

最新推荐文章于 2024-05-15 11:39:35 发布

阅读量1.8k

点赞数 3

本文链接：https://blog.csdn.net/tour_ying/article/details/102840019

版权

本文介绍了如何使用逻辑回归建立信贷评分卡，包括数据预处理（去重复、填充缺失值、处理异常值、相关性分析、样本均衡、划分训练测试集）、特征处理（分箱、计算WOE和IV值）、模型建立以及评分卡制作。通过Give Me Some Credit数据集，展示了从预处理到评分卡的完整过程。

摘要由CSDN通过智能技术生成

在借贷场景中，评分卡是用分数形式来衡量一个客户信用风险的大小，分数越高代表信用风险越小。

针对个人客户而言，评分卡分为三类，分别是：
A卡（Application score card）申请评分卡
B卡（Behavior score card）行为评分卡
C卡（Collection score card）催收评分卡。

而众人常说的“评分卡”其实是指A卡，又称为申请者评级模型，主要应用于相关融资类业务中新用户的主体评级。
一个完整的模型开发，有以下流程：

接下来，使用Give Me Some Credit数据集，总共15万条训练数据，介绍使用逻辑回归建立A卡的方法。

1 数据预处理

变量表：

变量名	变量解释
SeriousDlqin2yrs	是否有超过 90 天或更糟的逾期拖欠
RevolvingUtilizationOfUnsecuredLines	贷款以及信用卡可用额度与总额度比例
age	借款人的年龄
NumberOfTime30-59DaysPastDueNotWorse	35-59 天逾期但不糟糕次数
DebtRatio	负债比率
MonthlyIncome	月收入
NumberOfOpenCreditLinesAndLoans	未偿还贷款数量和信贷额度
NumberOfTimes90DaysLate	借款人逾期 90 天或以上的次数
NumberRealEstateLoansOrLines	不动产贷款或额度数量
NumberOfTime60-89DaysPastDueNotWorse	借款人已超过 60-89 天的次数，但在过去两年中没有更糟。
NumberOfDependents	家庭中的家属人数（配偶，子女等）

1.1 去重复值

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor
import seaborn as sns
import scipy

data = pd.read_csv('cs-training.csv')
data = data.iloc[:,1:]
data.shape()
data.info()

data.drop_duplicates(inplace=True)
data.index = range(data.shape[0])

1.2 填补缺失值

观察缺失数据可以发现，需要填补的特征是“收入”和“家属人数”。“家属人数”缺失很少，仅缺失了大约2.5%，使用均值来填补。“收入”缺失了几乎20%，并且“收入”对信用评分来说是很重要的因素，因此使用随机森林填补“收入”。

data.isnull().sum()
data['NumberOfDependents'].fillna(int(data['NumberOfDependents'].mean()),inplace=True)

def fill_missing_rf(x,y,to_fill):
    df = x.copy()
    fill = df.loc[:,to_fill]
    df = pd.concat([df.loc[:,df.columns!=to_fill],pd.DataFrame(y)],axis=1)
    y_train = fill[fill.notnull()] 
    y_test = fill[fill.isnull()] 
    x_train = df.iloc[y_train.index,:] 
    x_test = df.iloc[y_test.index,:] 
    from sklearn<

最低0.47元/天解锁文章

tour_ying

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
逻辑回归建立评分卡

标题呃呃呃---LogisticRegression1 数据预处理功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入Lo...
复制链接

扫一扫