信用评分模型是消费信贷管理中先进的技术手段,是现在金融行业常用的信用风险评估方法,本文从宏观上介绍评分模型的建模开发流程。
1. 明确问题
明确业务要解决的问题,确定时间窗口、标签的定义规则,以及模型的评价指标和数据来源。
在定义标签的时候需要注意:
- 要考虑到表现期的长短(有关表现期的定义可以参考观察期与表现期)
- 要考虑到期终表现与期中表现
- 要考虑到某些群体的不可确定性(假设3期以上为坏客户,如果有拖欠2期的,如果归为坏,这些账户在最终会还清欠款而回归好客户;如果定义为好客户,相当一部分会拖欠越来越严重成为坏账;考虑到它的两面性,可归类为‘不确定’,排除在模型样本之外)
- ‘坏’客户的定义必须简明,避免坏客户出现较大的不同质性
2. 数据获取
金融行业在多年的经营活动中积累了非常庞大的数据,在建立信用评分模型时往往不会使用全部的数据,因此就涉及到抽样。
抽样
- 随机抽样
- 分层抽样
建模样本要求
- 样本具有代表性:即样本能够代表过去和未来的总体
- 样本的充分性:总样本数量和各个类别中的样本数量充足
- 样本的时效性:观察期越近越好,要根据观察期和表现期长短及样本数量来定</