最近发现了一款使用python实现的评分卡相关技术的插件woe,这里总结分享一下。项目网址:https://github.com/boredbird/woe,安装方式十分简单,直接使用pip安装即可:
pip install woe
或者
pip installgit+https://github.com/boredbird/woe
一、 相关概念
1.1 最优分组
最优分组或者最优分群是一种进行变量分组划分的常用技术,它划分的最终结果是该变量的iv值或者其他参考指标最大化。它首先将变量按照一定步长,分为100或者N个小组,然后根据IV值,对这些小组进行划分(树分裂),划分成2、3、4、5、、、直到指定分组数目。
1.2 K-S值
将评估样本总体进行10等分(比如按照预测的欺诈分值),并按照违约概率进行降序排序,计算每一等份中违约与正常百分比的累计分布,绘制出两者之间的差异。K-s曲线中的最大值被称作k-s统计量。
1.3 相关系数
简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。