容易导致建模失败的原因:
1,样本逻辑前后有出入。如利率的调整,新增了差异较大的引流渠道等
2,样本量不足。该问题在业务初期建模和不上量渠道客群建模时常遇到
3,数据源变化。如新增了数据源(导致风控规则的变化),受政策影响导致数据源本身的获取发生了变化
4,前端风控规则频繁变化。如在样本放款时间内,风控规则频繁调整变化,会导致客群不稳定进而影响建模效果
5,渠道端客群变化。大部分渠道商会有自己的客户分群策略,如渠道端对分群策略做出调整,给到信贷机构的客群前后可能存在较大差异
常规补救措施:
1,检查样本取数逻辑和样本分月坏账率。可删除大幅偏离均值的(半)月份样本 ;检查欺诈样本和其他奇异样本是否删除
2,检查样本时间跨度内的业务逻辑和风控逻辑。如样本申请时间周期内业务逻辑和风控规则发生了较大变化,可选择和当前业务风控较相近的样本进行建模,删除差异较大的样本。该情况需和策略渠道人员沟通
3,特征工程并尝试使用不同模型进行建模。进行多种方式的特征工程,使用不同的算法模型进行反复尝试;
4,数据量充足时可先进行聚类,按聚类结果进行分组建模。聚类后,可先查看特征和标签之间的相关性是否有提升,如有,则大概率对建模有提升
非常规补救措施:
1,在数据集划分前删除部分样本。如通过svd删除异常值;通过聚类(t-sne,dbs等)删除离群值(或直接删除样本量最小的分组)。该方法会改变样本的真实分布,慎用。
2,在数据集中加入部分过往评分卡拒绝的样本(作为坏样本)参与建模。加入该部分拒绝样本后,一般情况下特征IV值会有所提升。建模后需对模型的坏账率进行适当的校准。
3,缩短模型样本表现期。缩短表现期后,在模型校验环节需注意对坏账情况的排序能力