之前一直在网上搜为什么在做评分卡的时候,要把bian变量转化为WOE,现在找到一定的原因,记录一下。
先说结论:转化为WOE后,WOE值与对应的违约率是呈单调相反的关系。
即WOE值越高,其违约率越低。
对应的违约率:该箱内,该箱坏样本占该箱总样本的比例。
因为没有转化前,违约率与变量的箱shi是没有太大关系的。
上图
很明显,cutpoint与badrate是没有线性关系的,而woe与badrate就是线性相关的。
之前一直在网上搜为什么在做评分卡的时候,要把bian变量转化为WOE,现在找到一定的原因,记录一下。
先说结论:转化为WOE后,WOE值与对应的违约率是呈单调相反的关系。
即WOE值越高,其违约率越低。
对应的违约率:该箱内,该箱坏样本占该箱总样本的比例。
因为没有转化前,违约率与变量的箱shi是没有太大关系的。
上图
很明显,cutpoint与badrate是没有线性关系的,而woe与badrate就是线性相关的。