计算代码重复率_催收评分卡（三）迁徙率模型_上（含成品视频）

最新推荐文章于 2024-04-15 11:05:12 发布

weixin_39634878

最新推荐文章于 2024-04-15 11:05:12 发布

阅读量1k

点赞数

文章标签：计算代码重复率

本文链接：https://blog.csdn.net/weixin_39634878/article/details/111702957

版权

今天介绍模型前，给大家分享下，目前出来的模型跑分结果：

催收评分卡模型的跑分结果https://www.zhihu.com/video/1119994958123331584

由展示的例子，可以看到，每天都会按照计划跑出来一个分好层级的客户清单，最后业务层会根据具体的情况做不同的策略管理。

日常重复性的处理工作，都能这样交给计算机，一来交给计算机做这些重复性的事，提高工作效率，二来减少出错率。

模型是每天都会定时处理，成品是由三部分组成：

计划定时模块+批处理模块+代码跑分模块（每个模块都在后续的教学视频中详细讲解，公众号就不涉及这块知识了）

本文主要介绍迁徙率模型和还款率模型，分别分为上篇跟下篇介绍这两者模型。至于失联模型，其实也不难做，难点是在于每家公司对失联客户的定义，

主要是需要把多长失时间内失联的客户定义为目标客群，这个多长时间一般会定义为一天或者三天或者七天。只要把这个定义好了，就很好办了，有需要可以私下找我。

接下来的文章着重介绍下迁徙率模型。

为了解释方便，我以下文章介绍到的都是把迁徙率模型统一叫叫催收卡了。

一.一般的迁徙率模型

一般说的迁徙率模式是一种为了计算资产坏账回收状态和不同状态下的流动资产的流动指标，仅仅反映当下的状态，不具有预测性。

我们本次需要开发的迁徙率预测模型，跟平时在催收部门所使用的迁徙模型叫法相同，但是算法却很不一样。在催收部门里，一般所所用的迁徙率的模型，指的是M0到M1,M1到M2，M2到M3等这些不同状态之间的迁徙的概率。比如M0-到M1的迁徙率计算公式是：分子是在处于M1这个状态下的在贷余额，分母是处于上一期处于M0的在贷余额，分组是前一期这批客户的在贷余额。所以在计算迁徙率算出来，可以表示资产不同时期的迁徙的情况。

迁徙率是个非常重要的指标，能反应当前催收状态的坏账回收情况。

比如下表：

（关于迁徙率模型还可参考下我之前的文章：催收小词典）

1.如果你们公司还没有一张催收评分卡，我是非常建议你开发一张迁徙率模型评分卡的。前期就可以做精准催收，做温馨提醒。有些同学说，温馨提醒，我们公司是全体客户都发催收短信的，这个就免了吧。

是，对于财大气粗的公司，不在乎每个月所发送的催收短信的费用。但是对于这些客户，难道不应该对某些重点客群加大催收的力度，除了催收短信外，不能使用ivr语音，或者力度再加猛点，使用人工提醒吗？你可以分成不同的对照组，把模型分出来的不同风险等级的客户，应用不同的策略，观察下使用的效果。要知道，有些公司的客群数量非常庞大，做催收精准，能进一步地提升催收效果，催回更多的逾期金额。

2.迁徙率模型的定义

迁徙率模型的重点在于定义合作状态间的迁徙，在我公司内部，当起初没有一张催收评分卡的时候，我把上期公司业务的迁徙状态为M0和DPD1-4天的客户定义为好样本，把本期DPD4+以上的客户定义为坏样本。

这里是有一些坑的，你在梳理客户状态的时候，是需要按照客户的dua-day的状态，把客户的还款计划表(list)和实际还款清单（payment_record）列出来的。比如对于A客户，还款日为每个月的1日。假如我们截取的客户5月跟6月的状态，那在5月1日至于6月1日，这段期间，如果客户没有逾期或者逾期在1-4天的情况下，我会考虑把A客户当成我们的建模样本，然后在6月1日到7月1日，这个观察期内，我会把客户是否逾期当成我的建模的考察的重要的目标变量。如果A客户逾期了，那他就是坏客户，如果不逾期就是好客户。

3.难点、重点与易错点

难点：对于某些时间观测点的客户，因为需要观测期需要有一个完整的pieod，所以在建模的时间窗口的选择上除了，常用的观察期、表现期还需要加上缓冲期，以保障客群能凑成一个完整的pierod。

重点：

因为这里是有区分观察期是非逾期和DPD1-4天的客户才属于建模样本，所以在这点在讲是因为需要把已经逾期的客户进行排除在外。因为我们此次建模只是预测从MO到DPD5+以上的客户，其他的客群我们是不做考察范围内的。

易错点：

催收评分卡的难道，也是我躺过最大的坑，就是非常容易用Y预测Y。何为Y预测Y，通俗点说就是非常容易用逾期的客户将他当下的表现的数据再去预测当下的行为。造成这种错误的原因是你在模型定义的时候，没有把控好模型的定义。

4.模型各项验证指标

1。模型参数的选择，首先应用的是传统的选择模型参数的方式，用的是IV值，在上一条中，如果你犯了我之前提到的用Y去预测Y的话，很抱歉，你将会出现某些变量的IV值异常大，有些已经突破1了。虽然在催收评分卡里有些变量的IV值确实比较高，但是iv值超过1的变量值，进入模型，肯定会拉升整个模型的精准度，你可能用一个变量做出来的ks值就能达到0.7。

ks值达到0.7好吗？不是说IV值越大越好吗？其实不然。

一个有区分能力的模型，其实KS值在0.3-0.6是比较理想的，如果达到0.7/ 0.8，等于模型已经将绝大多数的好或者坏客户在某个区间就分割开来了，之后的区间的客户将会有一个断崖式的切割，其实这样的模型出来是

非常畸形的。KS值，很多书籍都有提到最少不能少于多少，然而最大值却很少有书籍有明确提及到，在此明确表示,KS并不是真的越大就越好。

--------------------------------------------------------------------------

十年职场生涯，这个长期混迹在风控界和科技界，摸爬滚打的大叔，曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司，如果你想了解他，欢迎加入一起学习一起聊！

weixin_39634878

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算代码重复率_催收评分卡（三）迁徙率模型_上（含成品视频）

今天介绍模型前，给大家分享下，目前出来的模型跑分结果：催收评分卡模型的跑分结果https://www.zhihu.com/video/1119994958123331584由展示的例子，可以看到，每天都会按照计划跑出来一个分好层级的客户清单，最后业务层会根据具体的情况做不同的策略管理。日常重复性的处理工作，都能这样交给计算机，一来交给计算机做这些重复性的事，提高工作效率，二来减少出错率。模型是每天...
复制链接

扫一扫