评分卡分两类:申请评分卡(批准前)和行为评分卡(批准后):
1.申请评分卡的评分结果将决定:
1.估计的信用状况;
2.抵押物;
3.贷款额/信用额度;
4.贷款定价(利率水平)。
2.行为评分卡的评分结果更精确,因为基于更多交易数据:
1.审查信用重建;
2.审查信用额度;
3.制定清收策略(若违约);
4.审查贷款定价和贷款条件。
正常和违约的标准取决于逾期,一般设置60天、90天或180天的口径。
状态变量中:1表示违约,0表示正常
关于账户的不确定值:
1.若得分小于Sl,则该账户为违约;
2.若得分大于Sh,则该账户为正常;
3.若得分在两者之间,则该账户需要人工干预(要求提供额外信息如工资证明等)。
标准评分卡的优势:
1.易于理解;
2.每项加总得到信用分数使信用分数更透明;
3.比率odds ratio的使用;
4.各项变量的简单加法容易在各平台中实现;
5.对各个变量的不同取值范围赋予一定分数,使消费者清楚如何提高信用分。
评分卡的开发流程:
1.问题准备:
1.在具体业务或信贷历史的认识基础上,确定违约和正常的定义;
2.确定计划评分卡的范围,开发和实施窗口;
3.识别数据的范围和来源,内部还是外部,确保能得到数据;
4.设计项目管理计划,对时间、资源、人员进行管理。
2.数据获取和整合:
1.对于内部数据的使用,注意账户和客户的区别,多个客户会使用一个联名账户joint accounts;
2.对于外部数据的使用,注意合理选择外部数据供应商。
3.EDA与数据描述(主要是检查数据并理解其特征):
1.候选预测变量的单变量统计特征评价,取值在变量范围内的分布;
2.要素分析:计算每个候选预测变量分类或分段条件下的违约率分布;
3.通过列联表、关联性和相关性指标确定不同变量之间的检验关系。
4.数据准备:
1.耗时长,最重要;
2.创建包含开发评分卡模型所需的所有要素的唯一数据集;
3.需要进行大量的数据清洗和转换工作;
4.评分卡中所有变量都要进行证据权重(WOE)转换,对变量转换前,需要减少分类变量的基数,需要将连续变量分段。
(关于数据准备的内容参考Refaat M.(2006)《Data Preparation for Data Mining Using SAS》
5.变量选择:只选择表现出较强预测力的变量,减少变量的数量
6.模型开发:基于logistics回归模型
7.模型验证:
1.必须达到可接受的准确性水平;
2.必须稳健,能接受更广范围的数据集;
3.必须简单;
4.必须有意义,在业务变量和预测值方面是可解释的。
8.评分卡创建和刻度:logistics回归模型建立并通过检验后,转换为标准评分卡的形式
9.评分卡的实施:不同业务部门使用评分卡前,需要将评分卡转换为可实施代码,确定最终得分的临界值,以对应所需的业务行动。
拒绝演绎:评分卡开发使用的是审批通过且运行一段时间的账户数据,已经表现出正常或违约的账户状态。拒绝演绎是尝试去分析可能会违约并在评分卡开发前已经被拒绝的账户。
检测与报告:
1.判断评分卡的实际表现,并与开发阶段的预期对比;
2.计算某些特定参数,用以触发某些行动,比如重建评分卡、重设临界值或调整评分卡刻度;
1.申请评分卡的评分结果将决定:
1.估计的信用状况;
2.抵押物;
3.贷款额/信用额度;
4.贷款定价(利率水平)。
2.行为评分卡的评分结果更精确,因为基于更多交易数据:
1.审查信用重建;
2.审查信用额度;
3.制定清收策略(若违约);
4.审查贷款定价和贷款条件。
正常和违约的标准取决于逾期,一般设置60天、90天或180天的口径。
状态变量中:1表示违约,0表示正常
关于账户的不确定值:
1.若得分小于Sl,则该账户为违约;
2.若得分大于Sh,则该账户为正常;
3.若得分在两者之间,则该账户需要人工干预(要求提供额外信息如工资证明等)。
标准评分卡的优势:
1.易于理解;
2.每项加总得到信用分数使信用分数更透明;
3.比率odds ratio的使用;
4.各项变量的简单加法容易在各平台中实现;
5.对各个变量的不同取值范围赋予一定分数,使消费者清楚如何提高信用分。
评分卡的开发流程:
1.问题准备:
1.在具体业务或信贷历史的认识基础上,确定违约和正常的定义;
2.确定计划评分卡的范围,开发和实施窗口;
3.识别数据的范围和来源,内部还是外部,确保能得到数据;
4.设计项目管理计划,对时间、资源、人员进行管理。
2.数据获取和整合:
1.对于内部数据的使用,注意账户和客户的区别,多个客户会使用一个联名账户joint accounts;
2.对于外部数据的使用,注意合理选择外部数据供应商。
3.EDA与数据描述(主要是检查数据并理解其特征):
1.候选预测变量的单变量统计特征评价,取值在变量范围内的分布;
2.要素分析:计算每个候选预测变量分类或分段条件下的违约率分布;
3.通过列联表、关联性和相关性指标确定不同变量之间的检验关系。
4.数据准备:
1.耗时长,最重要;
2.创建包含开发评分卡模型所需的所有要素的唯一数据集;
3.需要进行大量的数据清洗和转换工作;
4.评分卡中所有变量都要进行证据权重(WOE)转换,对变量转换前,需要减少分类变量的基数,需要将连续变量分段。
(关于数据准备的内容参考Refaat M.(2006)《Data Preparation for Data Mining Using SAS》
5.变量选择:只选择表现出较强预测力的变量,减少变量的数量
6.模型开发:基于logistics回归模型
7.模型验证:
1.必须达到可接受的准确性水平;
2.必须稳健,能接受更广范围的数据集;
3.必须简单;
4.必须有意义,在业务变量和预测值方面是可解释的。
8.评分卡创建和刻度:logistics回归模型建立并通过检验后,转换为标准评分卡的形式
9.评分卡的实施:不同业务部门使用评分卡前,需要将评分卡转换为可实施代码,确定最终得分的临界值,以对应所需的业务行动。
拒绝演绎:评分卡开发使用的是审批通过且运行一段时间的账户数据,已经表现出正常或违约的账户状态。拒绝演绎是尝试去分析可能会违约并在评分卡开发前已经被拒绝的账户。
检测与报告:
1.判断评分卡的实际表现,并与开发阶段的预期对比;
2.计算某些特定参数,用以触发某些行动,比如重建评分卡、重设临界值或调整评分卡刻度;
3.检测评分卡中客户群的特征变化,已经这些变化对评分卡分值的冲击。
参考资料:《信用风险评分卡研究》