KS和IV近期都有较多接触,为深入了解两个指标,个人分析了两者的异同:
总体比较
异同 | KS | IV |
计算 | 两者都需要用到分组中好坏样本数量与总体好坏样本数量的比值。 KS计算需要的是好坏比率的累计值之差, IV用到的是同一分组好坏比率比值的对数。 | |
用法 | 两者都可以衡量变量的区分能力。 IV一般使用在变量的区分能力上。 KS一般用于模型的区分能力上。 | |
分箱影响 | 两者的数值都收到分箱数量的影响 IV:具有分箱数量越多IV值越大的趋势。 KS:具有分箱数量越多IV值越大的趋势,但波动较大。 | |
其他 | KS:在保证整体好坏比率不变情况,最佳KS前或后改变区间好坏比,不会影响KS值。 IV:在保证整体好坏比率不变情况下,最佳KS前或后改变区间好坏比,会影响IV值。 在保证整体好坏比率不变情况下,最佳分组前后都改变区间好坏比,会影响IV和KS值。 |
关于分箱数量对KS和IV的影响
分箱数量增加,KS和IV都有着增加的趋势,在前期比较明显,但是KS的波动较大,IV波动较小。
关于数值调整对KS和IV的影响
1.这是按照一定分组和好坏设定下的IV和KS值。
2.修改第1组和第2组的好坏比例,第1组坏样本减少10个,第2组增加10个。KS的值没有变化,但是IV的数值却有所增加。
3.修改第1组和第8组好坏分布,第1组坏样本减少10个,第8组增加10个。kS和IV都发生了变化。