模型融合算法思考
解决的问题:
1.最低风险那一档的客户能否再用其他评分做细分然后搞差异化定价
2.无法拿到别人的底层变量不能直接建
3.现有的方法无法同时满足稳定性、可解释性、风险区分度三方面的要求:boosting这种无可解释性,逻辑回归的话变量少且相关性较高很难分,稳定性不够;决策树的区分能力又较弱,分不细,且结果还需要人工调整
解决方案:
基于遍历搜索思想的评分融合
从左上角开始,找到风险最低的相邻的尚未评级的且样本量有统计意义的分区给同样的分,如果样本量达到阈值就把分级加一;对于没有统计意义的分区用它周围的点推断
高纬推广:
挑选分组最少的两两先合并
成效:和决策树相比在排序能力(是不是各组间递增)、风险细分能力(后4%的人风险更高,风险低的客群里假设要求风险<0.4的人更多)和稳定性上(psi)和评分可扩展性上都更强
和直接按风险划分的方式对比下来的优势?
可解释性更强,比如如果有散乱的几个点风险低是很难解释的