风控建模7：建模补救方法

模型老司机•彩峰

已于 2023-07-20 10:57:11 修改

阅读量216

点赞数 1

文章标签：机器学习算法 python 人工智能数据分析

于 2023-04-15 13:13:40 首次发布

本文链接：https://blog.csdn.net/weixin_60929208/article/details/130168784

版权

容易导致建模失败的原因：
1，样本逻辑前后有出入。如利率的调整，新增了差异较大的引流渠道等
2，样本量不足。该问题在业务初期建模和不上量渠道客群建模时常遇到
3，数据源变化。如新增了数据源（导致风控规则的变化），受政策影响导致数据源本身的获取发生了变化
4，前端风控规则频繁变化。如在样本放款时间内，风控规则频繁调整变化，会导致客群不稳定进而影响建模效果
5，渠道端客群变化。大部分渠道商会有自己的客户分群策略，如渠道端对分群策略做出调整，给到信贷机构的客群前后可能存在较大差异

常规补救措施：

1，检查样本取数逻辑和样本分月坏账率。可删除大幅偏离均值的（半）月份样本；检查欺诈样本和其他奇异样本是否删除
2，检查样本时间跨度内的业务逻辑和风控逻辑。如样本申请时间周期内业务逻辑和风控规则发生了较大变化，可选择和当前业务风控较相近的样本进行建模，删除差异较大的样本。该情况需和策略渠道人员沟通
3，特征工程并尝试使用不同模型进行建模。进行多种方式的特征工程，使用不同的算法模型进行反复尝试；
4，数据量充足时可先进行聚类，按聚类结果进行分组建模。聚类后，可先查看特征和标签之间的相关性是否有提升，如有，则大概率对建模有提升

非常规补救措施：
1，在数据集划分前删除部分样本。如通过svd删除异常值；通过聚类（t-sne，dbs等）删除离群值（或直接删除样本量最小的分组）。该方法会改变样本的真实分布，慎用。
2，在数据集中加入部分过往评分卡拒绝的样本（作为坏样本）参与建模。加入该部分拒绝样本后，一般情况下特征IV值会有所提升。建模后需对模型的坏账率进行适当的校准。

3，缩短模型样本表现期。缩短表现期后，在模型校验环节需注意对坏账情况的排序能力