SDU项目实训记录4.1——模型稳定性
一、PSI(Population Stability Index)
定义: 群体稳定性指标PSI是衡量模型的预测值与实际值偏差大小的指标;稳定度指标可衡量测试样本及模型开发样本评分的分布差异,为最常见的模型稳定度评估指标。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。
计算: 首先对样本A和样本B得分按照同一标准分为几个区间(类别型变量按类别分),计算样本在每个区间上的占比。在每个区间上,将两个样本各自占比相除再取对数,然后乘以各自占比之差,最后将各个区间的计算值相加,最终得到PSI(类似于IV计算),如下:
P S I = ∑ i ( A i / A t − B i / B t ) ∗ l n ( A i / A t B i / B t ) PSI=\sum_{i}{(A_i/A_t-B_i/B_t)*ln(\frac{A_i/A_t}{B_i/B_t})} PSI=i∑(<