评分卡模型剖析之一(woe、IV、ROC、信息熵)

本文深入剖析信用评分卡模型,重点讨论WOE和IV原理。WOE反映了自变量对违约比例的影响,IV衡量自变量对目标变量的信息量。通过ROC曲线评估模型效果,WOE编码能提升模型预测效果和可理解性,同时揭示自变量与目标变量的非线性关系。
摘要由CSDN通过智能技术生成

信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广义线性模型。

       本文重点介绍模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为违约用户,对于目标变量为0记为正常用户;则WOE(weight of Evidence)其实就是自变量取某个值的时候对违约比例的一种影响,怎么理解这句话呢?我下面通过一个图标来进行说明。

Woe公式如下:






Age

#bad

#good

Woe

0-10

50

200

=ln((50/100)/(200/1000))=ln((50/200)/(100/1000))

10-18

  • 8
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
WOE信用评分是一种基于WOE(Weight of Evidence)转换的信用评分模型,常用于风控领域。在Python中,我们可以使用pandas库和sklearn库中的一些模块来实现WOE评分模型的构建。 首先,我们需要对数据进行分箱处理,并计算每个分箱中好坏样本的数量,从而计算出每个分箱中好坏样本的比例和WOE。然后,我们可以使用LogisticRegression模型进行拟合,得到每个特征的系数,进而计算出每个样本的分数。 下面是一个简单的示例代码: ```python import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.metrics import roc_auc_score # 分箱函数 def binning(col, target, max_bins=10): bins = pd.qcut(col, max_bins, duplicates='drop') grouped = df.groupby(bins)[target].agg(['count', 'sum']) grouped['bad_rate'] = grouped['sum'] / grouped['count'] return grouped # 计算WOE def calc_woe(grouped): total_good = grouped['sum'].sum() total_bad = grouped['count'].sum() - total_good woe = pd.Series() for idx, row in grouped.iterrows(): good = row['sum'] bad = row['count'] - good woe[idx] = np.log((good / total_good) / (bad / total_bad)) return woe # 数据导入 df = pd.read_csv('credit.csv') # 分箱处理 binning_result = binning(df['age'], df['target']) woe_age = calc_woe(binning_result) # LogisticRegression模型拟合 X = pd.cut(df['age'], bins=binning_result.index, labels=woe_age) y = df['target'] lr = LogisticRegression() lr.fit(X.to_frame(), y) # 计算AUC y_prob = lr.predict_proba(X.to_frame())[:, 1] auc = roc_auc_score(y, y_prob) print('AUC score:', auc) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值