信用评分卡模型开发中双峰分布原因及解决方案

最新推荐文章于 2024-05-31 09:44:20 发布

weixin_34409703

最新推荐文章于 2024-05-31 09:44:20 发布

阅读量2.7k

点赞数 1

文章标签：数据结构与算法

信用评分卡模型开发中双峰分布原因及解决方案

文：郑旻圻邹钰刘巧莉

转自：数信互融

在信用评分卡模型开发过程中，正态性是检验模型信用评分分布是否有效的一个重要指标。正常情况下，标准的正态分布是单峰分布；但是在实际建模过程中，会遇到信用评分分布出现双峰的情况。

双峰分布出现时，数据规律一致性的假设被打破，我们需要从不同的角度考察其出现双峰分布的原因，对模型加以调整，使之准确地反映业务和数据中的规律，以便模型准确适用。

根据为数十家互联网金融企业建立评分卡模型的实践经验，我们总结了一些造成双峰分布的因素。

本文将从业务模式、录入系统变更和变量这三个角度，对信用评分分布的双峰情况加以分析并解释其出现的原因。通过实际案例，通过具体解决方案的分享，与读者共同探讨交流讨论。

1

参考模型：违约模型（先息后本和等本等息的混合模型）

解释角度：业务模式（或者叫好坏客户定义模式）

根据项目初期的好坏客户定义，评分分布如图1所示。其中出现了双峰分布。

图1 信用评分分布直方图

考虑到好坏客户定义与实际业务模式相差较大且坏客户占比过低，采取重新定义好坏客户。新的评分分布直方图如图2所示。

最低0.47元/天解锁文章

weixin_34409703

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
信用评分卡模型开发中双峰分布原因及解决方案

信用评分卡模型开发中双峰分布原因及解决方案文：郑旻圻邹钰刘巧莉转自：数信互融在信用评分卡模型开发过程中，正态性是检验模型信用评分分布是否有效的一个重要指标。正常情况下，标准的正态分布是单峰分布；但是在实际建模过程中，会遇到信用评分分布出现双峰的情况。双峰分布出现时，数据规律一致性的假设被打破，我们需要从不同的角度考察其出现双峰分布的原因，对模型加以调整，使之准确地反...
复制链接

扫一扫

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄8年

154: 原创

-: 周排名

-: 总排名

156万+: 访问

: 等级

9545: 积分

1万+: 粉丝

276: 获赞

36: 评论

1675: 收藏

私信

关注

热门文章

最新评论

七周七语言——Prolog（二）
芙蓉荟蔬汤: 第一个例子应该是 ancestor(X,Y) :- father(X,Z),ancestor(Z,Y)
GWAS | 全基因组关联分析 | PLINK | 实战 | 统计遗传学
weixin_48885434: 博主您好，我用plink进行关联分析时，加入前10个pca作为协变量，结果文件显示beta值和p值都为NA，请问是什么原因呀？
Nodejs如何调用Dll模块
yuanyi正: 装环境都搞死
上传图片到阿里云OSS和获取上传图片的外网url的步骤
大圣-Alec: String name = random.nextInt(10000) + System.currentTimeMillis() + substring; try { InputStream inputStream = file.getInputStream(); this.uploadFile2OSS(inputStream, name); return name; } catch (Exception e) { throw new ImgException("图片上传失败"); } 返回这个name 确定可以？
PyShark入门(1)：简介
麦兜兒: 请问如何保存为csv文件呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。