模型稳定度指标PSI 释义及计算示例

最新推荐文章于 2025-04-15 09:57:13 发布

黑山老妖橙

最新推荐文章于 2025-04-15 09:57:13 发布

阅读量2.5w

点赞数 11

本文链接：https://blog.csdn.net/liuliuliuliumin123/article/details/84664651

版权

稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异，为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后，针对不同样本，或者不同时间的样本，population分布是否有变化，就是看各个分数区间内人数占总人数的占比是否有显著变化

PSI小于0.1时候模型稳定性很高，0.1-0.2一般，需要进一步研究，大于0.2模型稳定性差，建议修复。

psi计算公式为：psi = sum(（实际占比-预期占比）* ln(实际占比/预期占比))

示例：

有一个模型主要生成用户分组，输出参数为group01-group10,我们需要统计该模型是否稳定，以验证我们的建模是否合适

第一步：统计总进件量（数据库统计），如总进件量为3400条数据

第二步：将总进件量按区间统计出各分区间量

假如统计出的结果如下：