模型稳定度指标PSI 释义及计算示例

稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化

PSI小于0.1时候模型稳定性很高,0.1-0.2一般,需要进一步研究,大于0.2模型稳定性差,建议修复。

psi计算公式为:psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))

示例:

有一个模型主要生成用户分组,输出参数为group01-group10,我们需要统计该模型是否稳定,以验证我们的建模是否合适

第一步:统计总进件量(数据库统计),如总进件量为3400条数据

第二步:将总进件量按区间统计出各分区间量

假如统计出的结果如下:

group01100
group02200
group03300
group04500
group05700
group06800
group07100
group08100
group09500
group10100

第三步:算出各区间占比(本区间数/总进件数)

实际占比
2.94%
5.88%
8.82%
14.71%
20.59%
23.53%
2.94%
2.94%
14.71%

2.94%

 

第四步:我们自己有一个期望占比

预期占比
2%
8%
13%
17%
18%
6%
11%
9%
13%
3%

 

第五步:计算各区间psi并最终进行求和,从结果来看我这个模型应该重做哈哈哈。不过我的预期占比是随便写的,所以才有这个结果。整体的计算流程就是这样了,psi的计算公式为:psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))

  • 11
    点赞
  • 69
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值